测试采集的时候都有,一到发布,就说没有了
同求啊啊啊
我看了源码,大概知道是怎么回事了。
抓过的网址都会被记录在一张叫做 xxx_collected的表中,下次再去采集的时候就不会采集了,也就是显示没有采集数据。
发布的时候也是要先采集,因为xxx_collected表中有记录,所以也就没数据(系统认为之前已经采集过了),自然也不会发布了。
解决办法:
1.打开XXX_collected表,将记录删除即可。
2.修改源码,不读取XXX——collected表中的数据
本帖最后由 zmh886 于 2019-5-13 21:34 编辑
xiaoxiong1997 发表于 2019-5-4 12:56
我看了源码,大概知道是怎么回事了。
抓过的网址都会被记录在一张叫做 xxx_collected的表中,下次再去采集 ...
最简单的办法是,采集规则-采集器设置:网址不排重 改为“是”,这是需要重复采集同一个内容时需要设置。
如果只是需要重新采集刚才采集过的某个内容的话,找到 已采集数据 已采集数据列表 删除掉需要采集的网址对应的记录即可。
相关知识点: 数据 网址 都会
- 1PbootCMS英文站搜索结果页面包屑和标题翻译
- 2蓝天采集器蓝天采集好像不支持伪原创哦
- 3蓝天采集器jsnop如何采集?
- 4dedecms自定义标签导入pbootcms出现Error while executing SQL query on database cannot commit - no transaction is active解决办法
- 5蓝天采集器关于列表页当作内容页采集的疑问
- 6蓝天采集器请问一下,多个任务是否可以单独控制采集数量
- 7宝塔控制面板php.ini文件在那个文件目录里面
- 8蓝天采集器出现无法加载数据库驱动什么情况!求解决!!!!
- 9Typecho1.1轻博客在线安装操作教程
- 10极致cms公共配置
- 11PbootCMS性能优化研究之网页响应速度
- 12蓝天采集器内容允许匹配多个元素循环入库教程
- 13蓝天采集器建议:下个版本能否开发将“发布设置”导入导出?
- 14蓝天采集器如何倒序采集
- 15阿里云ESC服务器linux系统CentOS7.6安装SSL工具FinalShell教程
- 16蓝天采集器任务列表应新增复制功能
- 17蓝天采集器采集出现代码,什么意思
- 18蓝天采集器版主吧群公布出来吧。
- 19蓝天采集器建议增加实用功能
- 20163K网站系统阿里短信状态全部是发送中的解决办法
-
蓝天采集器Discuz发布帖子不显示···
内容里面有图片,有什么方法可以解决吗
-
蓝天采集器XPath规则插件-火狐f···
火狐浏览器firebug和firepath插件安装方法(最新)。以下为具体步骤。第1步:下载火狐55以内版本安装包,安装时迅速设置禁止自动更新版本,取消勾选自动更新(目的是防止火狐浏览器自动升级)54版本火狐浏览器的下载地址:64位火狐54···
-
蓝天采集器有没有附件同步到OSS服务···
不能,会代码的话可以在发布设置选 自定义插件,自行开发功能
-
蓝天采集器在测试爬取字段的时候,一直···
抓取源码正常吗? 有没有设置关联页、分页? admin 发表于 2018-5-7 09:00 抓取源码正常吗? 有没有设置关联页、分页? 爬去源码正常, 但如果 Xpath 拉去太多的话 貌似就开始转圈了, 我对关联页 和 分页的···
-
阿里云SSL证书在宝塔控制面板配置教···
最近蜀戎网接到几个咨询如何把阿里云申请的ssL证书部署到宝塔的控制面板上面,今天就给大家分享一下操作教程。首先登录阿里云控制后台----SSL证书管理----已签发证书----找到对应证书点击下载。点击已签发证书在这里选择我们对应的版本就可···