之前设置了补全网址,然后改了不补全网址了,但是还是自动补全了,用内容替换页去不掉网址,有人知道怎么回事吗?
嗯,这是个bug
暂时解决》内容替换:
- <a href="([^"]+)"
- <a href="填写域名$1"
我也遇到了,弄得我死去活来,各种检查也没搞定。原来真是bug啊
admin 发表于 2018-8-31 21:33
嗯,这是个bug
暂时解决》内容替换:
我为了这个弄了两个小时,死去活来啊,不懂正则表达式,所以内容替换弄不好。
我采集到的是a标签内容磁力链接,补全网址之后就不能用了,应该怎么替换呢? 链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
- <a href="[内容1]">
admin 发表于 2018-9-9 21:38
链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
谢谢建议,只是因为链接有很多,而且分段标题,单独采集很难后期组合。
所以我整段采集然后整体做处理比较现实。
最后唯一的问题就是磁力链接在 a标签内被强制补齐。
我现在是采集后,在数据库中批量替换关键词来处理的。如果后续能修复网址补全这个问题就太好了。
admin 发表于 2018-9-9 21:38
链接不在a标签中就不会自动补齐
你直接提取链接即可,比如规则写
这个我知道,因为数据特点,这样会造成后面数据处理的麻烦,所以只能整体采集。
不过,数据库替换也还好,采集完成后一键批量处理。 暂时解决不了,后期修复 我的好像没遇到过这样的问题呢、取消了就取消了
qijianchuan 发表于 2018-9-21 23:32
我的好像没遇到过这样的问题呢、取消了就取消了
已经修复了 相关知识点: 链接 内容 发表于
- 1蓝天采集器翻译功能可否增加腾讯翻译君API?
- 2蓝天采集器开启自动采集总是莫名其妙自己停止了
- 3蓝天采集器采集的永远是第一页
- 4蓝天采集器蓝天采集器安装时候出现的问题
- 5{pboot@sql sql="语句"}[sql:字段]{/pboot@sql}万能循环标签使用介绍
- 6蓝天采集器chrome提取的xpath规则可以通过调试却抓不到数
- 7蓝天采集器官方的云平台cms发布插件要怎么使用
- 8蓝天采集器discuz发帖分类怎么加,是添加什么代码
- 9PbootCMS内容轮播多图增加标题和描述
- 10蓝天采集器自动采集-访问触发 里面的参数怎么啊?有没有大神解答一下
- 11pbootcms升级到3.0.3+最新版文章点击后跳转首页解决办法
- 12PbootCMS后台登录验证码看不清怎么回事?
- 13pbootcms栏目内容-详情页设置输出html
- 14163K网站系统微信支付配置教程(S版)
- 15蓝天采集器Discuz发布帖子不显示缩略图
- 16火车头采集国外英文网站教程分享
- 17RGCMS在线安装操作教程
- 18蓝天采集器有没有可能增加这么一个“采集筛选”的功能?
- 19蓝天采集器批量添加起始网址数量有问题
- 20蓝天采集器采集网址总是提示“页面为空”是怎么回事?
-
蓝天采集器为什么我的采集间隔失效了
在我本机上采集间隔测试有效,部署到虚拟主机采集间隔就完全失效了。不管设置再大再小都是失效。这是为什么啊?设置什么都一样啊。 有bug下个版本修复
-
163K网站系统好店商家如何扫码核销
商城中的商家管理员/核销员工的核销方式:微信中 登录网站登陆之后, 关闭网页界面 返回微信界面 选择 微信扫一扫对会员的核销码 进行 扫一扫微信中会自动打开核销确认界面 如下核销完成好店商家如何添加核销员工1、员工先在网站上注册开通个账号(···
-
163K网站系统商城物流跟踪-快递鸟···
此教程是网站后台-商城-基本配置-基本配置-快递鸟接口配置的配置教程,其作用是在未送达的订单中显示该订单快递单号的物流跟踪状态。1、注册登陆http://www.kdniao.com/api-track,在用户信息界面 可以获取到 用户ID···
-
蓝天采集器BUG反馈
NGINX环境中,预先配置伪静态再安装采集程序报错,需要先安装采集程序,再配置伪静态。 谢谢反馈,该程序基本上不强求伪静态的,除了发布为api接口(也可以用动态的)
-
蓝天采集器请问时间转换为时间戳这个工···
提示已经说得很明白了,默认传递当前字段的值就是默认会将你的发布时间字段转时间戳,直接点确定就可以 你的时间 2017年02月08日 有中文 要处理下才能转 加个处理》内容替换 年|月|日替换成 / 放在函数前面