之前设置了补全网址,然后改了不补全网址了,但是还是自动补全了,用内容替换页去不掉网址,有人知道怎么回事吗?
嗯,这是个bug
暂时解决》内容替换:
- <a href="([^"]+)"
- <a href="填写域名$1"
我也遇到了,弄得我死去活来,各种检查也没搞定。原来真是bug啊
admin 发表于 2018-8-31 21:33
嗯,这是个bug
暂时解决》内容替换:
我为了这个弄了两个小时,死去活来啊,不懂正则表达式,所以内容替换弄不好。
我采集到的是a标签内容磁力链接,补全网址之后就不能用了,应该怎么替换呢? 链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
- <a href="[内容1]">
admin 发表于 2018-9-9 21:38
链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
谢谢建议,只是因为链接有很多,而且分段标题,单独采集很难后期组合。
所以我整段采集然后整体做处理比较现实。
最后唯一的问题就是磁力链接在 a标签内被强制补齐。
我现在是采集后,在数据库中批量替换关键词来处理的。如果后续能修复网址补全这个问题就太好了。
admin 发表于 2018-9-9 21:38
链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
这个我知道,因为数据特点,这样会造成后面数据处理的麻烦,所以只能整体采集。
不过,数据库替换也还好,采集完成后一键批量处理。 暂时解决不了,后期修复 我的好像没遇到过这样的问题呢、取消了就取消了
qijianchuan 发表于 2018-9-21 23:32
我的好像没遇到过这样的问题呢、取消了就取消了
已经修复了 相关知识点: 链接 内容 发表于
- 1zblog蓝天采集器发布插件带评论置顶标签
- 2网站的外链资源圈如何来建立
- 3163K网站系统微信支付配置教程(S版)
- 4FastAdmin系统-Bty分销系统v5蓝天采集器自动采集入库使用教程
- 5蓝天采集器列表页 分页如何设置
- 6蓝天采集器Discuz发布帖子不显示缩略图
- 7163K网站系统《163K网站系统》HTTPS介绍、基本教程、代操作套餐服务
- 8蓝天采集器数据处理内容替换 支持正则吗
- 9蓝天采集器关于绑定cms及自己开发的cms发布应用的问题
- 10蓝天采集器刚下载了2.2版本的,不知道该怎么使用?
- 11163K网站系统微信小程序注册流程与代码发布教程
- 12蓝天采集器求Xiuno BBS发布接口
- 13蓝天采集器如何导入发布插件操作教程
- 14163K网站系统浏览器中的网站图标(favicon.ico图标)设置说明
- 15蓝天采集器支持苹果cms吗
- 16蓝天采集器无法安装怎么回事???
- 17蓝天采集器发布方式不能选择post方式发布嘛?
- 18pbootcms栏目内容-详情页设置输出html
- 19pbootcms常见标签调用学习
- 20蓝天采集器数据库插入数据时候的问题
-
蓝天采集器采集器取消了自动补全网址,···
之前设置了补全网址,然后改了不补全网址了,但是还是自动补全了,用内容替换页去不掉网址,有人知道怎么回事吗? 嗯,这是个bug 暂时解决》内容替换:<a href="([^"]+)"复制代码<a h···
-
PbootCMS建站系统模板新手必读···
环境要求服务器:Linux / Windows / Nginx / Apache / IIS PHP版本:不小于5.3,完美支持php7。推荐PHP5.6和PHP7.3MYSQL版本:5.0以上。推荐···
-
蓝天采集器hadsky采集
可以增加随机id用户发表帖子和随机评论和随机阅读量吗? 可以不可以增加采集站登录缓存,避免要登录才能采集。 需要增加功能,直接改插件文件 登录缓存:任务》采集器设置》请求头信息》Cookie 缓存数据
-
蓝天采集器chrome提取的xpat···
新手完全按照手册来的,自己尝试用后台的中国农业网新闻做测试,把原来的规则匹配改为chrome提取的xpath却一直抓不到数据,反倒是用chrome或xpathhelper插件匹配都是可以的,是规则写的不对么? 比如抓标题"http···
-
蓝天采集器内容允许匹配多个元素循环入···
我们平时在采集一些论坛或者贴吧,问答平台等都会有多段内容,在写采集规则的时候我们就要换一种操作方法,利用我们的循环入库。我们就以http://bbs.skycaiji.com/forum.php?mod=viewthread&tid···