本帖最后由 伍六柒 于 2019-3-13 18:52 编辑
使用的版本是2.0,使用了wordpress插件发布,但发布后分类无法对应,有时是未分类,但经常是最后一个分类,并不是自己选择的分类。还有标签是没有设置的,但是发布后会多出来标签,随机 的。不知道什么情况???
本帖最后由 伍六柒 于 2019-3-14 09:58 编辑
找到问题了,WP的程序默认是全部文章导入POST,但关联分类是另一个表,但那个表是采集的保留2条数据位置的方法,也就是如果只有一条分类信息则必须将分类ID+1,不然就会造成未分类(分类失败),所以解决方法有两个,一是WP发布插件中使用分类+1.二是手动填写分类ID自己+1 。
还有,发现分类是取出所有iterm,而不是实际的分类列表,也会造成很多问题,取出真正分类的代码如下:
- $catsDb= $this->db()->table( '__TERMS__' )
- ->alias( 't' )
- ->join( '__TERM_TAXONOMY__ e', 'e.term_id = t.term_id' )
- ->where( [ 'e.taxonomy' => 'category' ] )
- ->select();
话说,老大很久没出现了,不知道提的问题建议会不会有用,但还是继续提一条:
很多时候采集失败的原因是超时,现在蓝天采集也会记录下失败的地址,但只是记录,我的建议是是否加入一个筛选,选出那些失败的,然后可以只针对采集失败的再次采集。
嗯,你可以改插件代码实现你的需求
2.1版本 已采集数据中有个“一键清除失败的网址”功能,可以试试
admin 发表于 2019-3-14 18:04
嗯,你可以改插件代码实现你的需求
2.1版本 已采集数据中有个“一键清除失败的网址”功能,可以试试 ...
收到 谢谢老大 相关知识点: 你的 插件 代码
- 1蓝天采集器可以在任务列表做一个复制的功能吗?
- 2pbootcms类型站点怎么查看图片、网页元素的路径和大小和颜色
- 3个别主机下PbootCMS后台点击状态按钮后自动跳转到首页
- 4蓝天采集器请教数据采集覆盖或修改之前入库信息的设置
- 5蓝天采集器想爬去的页面 需要点击开始后才能出结果 怎么爬取
- 6蓝天采集器蓝天采集器1.2版本正式发布
- 7蓝天采集器采集报错500 Internal Server Error
- 8蓝天采集器不算BUG的BUG(发布方式为数据库插入成功却提示失败)
- 9dedecms转pbootcms常见标签转换教程
- 10蓝天采集器数据库 发布失败 发布以一条后停止
- 11蓝天采集器安装出问题 显示版本问题
- 12pbootcms蓝天采集器发布插件制作参数教程
- 13PbootCMS配置面包屑导航
- 14蓝天采集器建议官方参照简数补充一些功能
- 15蓝天采集器wordpress发布到网站数据库需怎样设置入库规则?
- 16ZKEYS公有云业务管理系统蓝天采集器自动采集入库操作教程
- 17蓝天采集器能不能采集内容分页呀。我看了好像不行
- 18PbootCMS内容详情页自定义模板文件
- 19蓝天采集器这个网页怎么采集
- 20蓝天采集器多级网址获取的内容全部相同
-
火车头使用5118伪原创出现采集内容···
当我们在用5118伪原创插件的时候总是会遇到各种各样的问题,今天蜀戎网就给大家分享一下当运行插件报错出现:采集内容处理插件运行出错:【errcode】:20031 【errmsg】【errcode】:200313 【errmsg】动态加载d···
-
蓝天采集器请问 获取内容页中,内容以···
-
极致cms使用常见问题集合
1、比如一个用户在登录前台,从后台删除这个用户,但是这个用户依然可以发表评论,打开用户中心。解决办法:清空session导致出现这个原因是cookie的缓存,前台用户需要退出才可以,如下图所示。2、访问后台出现:PHP Notice: Un···
-
蓝天采集器采集微信公众号操作教程
微信公众号是一个活跃量非常高的信息流平台,许多的站长都有自己的公众号,在上面发布了许多的信息,由于平台没有导出的功能,发布的信息比较多,手动复制也不太现实,所以呢我们就需要用一些工具到进行导出到我们需要的平台上面。微信公众号的内容有2个途径···
-
蓝天采集器图片本地化问题,请问一下站···
已经提取出图片地址 发布方式 是直接提交到数据库了,请问一下应该怎么设置,能先把图片本地化,然后再提交数据库。 暂时还不支持链接形式下载图片,可以参考下http://bbs.skycaiji.com/forum.php?mod=vie···