蓝天采集器采集的到内容但是发布时没采集到

2019-04-05 182 19 编辑:aim 来源:蓝天采集社区

测试采集的时候都有,一到发布,就说没有了
同求啊啊啊 我看了源码,大概知道是怎么回事了。
抓过的网址都会被记录在一张叫做 xxx_collected的表中,下次再去采集的时候就不会采集了,也就是显示没有采集数据。

发布的时候也是要先采集,因为xxx_collected表中有记录,所以也就没数据(系统认为之前已经采集过了),自然也不会发布了。

解决办法:
1.打开XXX_collected表,将记录删除即可。
2.修改源码,不读取XXX——collected表中的数据 本帖最后由 zmh886 于 2019-5-13 21:34 编辑

xiaoxiong1997 发表于 2019-5-4 12:56
我看了源码,大概知道是怎么回事了。
抓过的网址都会被记录在一张叫做 xxx_collected的表中,下次再去采集 ...

最简单的办法是,采集规则-采集器设置:网址不排重 改为“是”,这是需要重复采集同一个内容时需要设置。
如果只是需要重新采集刚才采集过的某个内容的话,找到 已采集数据 已采集数据列表 删除掉需要采集的网址对应的记录即可。

相关知识点: 数据 网址 都会
本站文章均为蜀戎网络摘自权威资料,书籍,或网络原创文章,如有版权纠纷或者违规问题,请即刻联系我们删除,未经允许禁止复制转载!感谢...

在线
客服

在线客服服务时间:9:00-21:00

客服
热线

13227777380
7*24小时客服服务热线

客服
微信

扫一扫微信咨询
顶部