本帖最后由 伍六柒 于 2018-8-24 18:21 编辑
一、
图片本地化;某些站点失败几率很大,一篇文章有10个图片,只能成功10%左右,其它的依然是源图地址,设置了本地化间隔3秒依然没能解决。猜测应该就是对方限制了访问频率。
关键有一个BUG:如果设置了图片本地化间隔大于2秒(2秒以上比如3秒),采集任务就只能采集一条就会中断,其它的不会继续采集!
二、
在数据处理中,内容替换里能否加个替换说明? 因为,比如看图
在数据处理的地方,正则使用太多了后,管理很不方便,点开以后要慢慢看正则理解,才知道当时自己做了什么操作? 如果有一个简单的说明(自己填10字以内),然后就非常漂亮了!
三、
目前去重我看到蓝天有两个地方管控,一是采集字段那里去重;二是通过已采集网址区分,已存在则跳过。
我个人的建议是有一个设定,如果发现已采集网址中已经存在的,允许设定是更新操作,还是跳过操作,因为有很多场景下是需要更新同一样源地址!
图片下载失败可能是下载速度的问题,采集设置》图片本地化》下载超时
其他会改进
- 1蓝天采集器出现无法加载数据库驱动什么情况!求解决!!!!
- 2蓝天采集器数据库 发布失败 发布以一条后停止
- 3蓝天采集器采集内容时出现:bool(false)无响应状态解决办法
- 4163K网站系统阿里短信状态全部是发送中的解决办法
- 5蓝天采集器替换功能不正常 BUG反馈
- 6蓝天采集器请问一下 多级网址获取 应该怎么使用
- 7蓝天采集器需要多表发布,ID关联,能获取上一个表的自增ID的功能
- 8163K网站系统公众号模板消息配置教程
- 9蓝天采集器发布设置问题
- 10蓝天采集器BUG反馈:标题排重无法正常使用
- 11蓝天采集器采集列表中能否增加单选按框和批量采集按钮
- 12蓝天采集器无法检测到本地CMS
- 13狂雨小说CMS-狂雨小说下载-采集规则-导入方法
- 14蓝天采集器安装不了,啥情况
- 15蓝天采集器测试的时候没有问题。真正采集出现这种问题
- 16蓝天采集器数据库发布时遇到组合的怎么办
- 17蓝天采集器jsnop如何采集?
- 18阿里云windows服务器买了单独的云盘如何挂载数据盘在服务器上面教程
- 19PbootCMS升级时文件IndexController.php更新失败,请重试!解决办法
- 20多语言建站看这里:PbootCMS多语言建站常见问题(如何搭建中英文站)
-
蓝天采集器发布数据库
请问怎么才能支持远程mssql呢? 我想发布到远程服务器的数据库中,数据库是微软的sql sever 其实这个采集器功能真的越来越好用了,我记得以前用米拓的时候,那时候购买的采集插件的也很方便,希望这个采集器能越来越强大。 mssql还···
-
网站SEO优化100条解答经验分享5···
56:我们还是从三个方面来分析 1、标题 2 、导航 3、布局。57:企业网站就当企业形象展示就行了。建议还是单独作战,牵一发而动全身太多阻挠了。58:不要没事就更新文章了。除非这个文章是要去参与长尾排名或者是对客户有特别需求的,没有就一个···
-
蓝天采集器请问 获取内容页中,内容以···
-
蓝天采集器百度知道问题列表页测试抓取···
测试页面:https://zhidao.baidu.com/list?cid=110 使用采集器的 “测试抓取” 获取源码 问题列表部分只有一行字“当前没有适合您回答的问题,您可以尝试订阅更多兴趣标签。” 用QQ浏览器内的小号功能打开新···
-
163K网站系统自动升级常见报错检查···
在使用自动升级过程 ,可能会遇到一些报错,这里列举一些常见问题的检查解决办法 一 、 进度为1%时 提示 升级升级exe失败....。升级终止 0>升级服务没有启动 在服务器 开始 运行中 输入 services.msc 回车 后 ···