蓝天采集器站长采集规则不能直接写正则表达式吗

2018-05-17 229 19 编辑:juemeialg 来源:蓝天采集社区

蓝天采集器站长采集规则不能直接写正则表达式吗 我这样去匹配 标题 在正则调试工具中是能匹配出来的 采集器环境中就不行了 只能<h1>[内容]</h1>这样匹配吗
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值

admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值

能直接支持正则就好了
admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值

请问运用 [内容]和捕获组这两个有什么区别么
juemeialg 发表于 2018-5-17 22:45
能直接支持正则就好了

支持正则的,只是说返回的匹配数据需要用个[内容]标签来装,可以过滤不要的html代码达到精准匹配,你肯定不想把<h1>也输出到标题里吧? 而捕获组也是正表达式的语法,百度下就知道了
wangchenyuF2 发表于 2018-5-18 01:21
请问运用 [内容]和捕获组这两个有什么区别么

[内容]是泛匹配,捕获组可以写正则精准匹配

相关知识点: 内容 正则 发表于
本站文章均为蜀戎网络摘自权威资料,书籍,或网络原创文章,如有版权纠纷或者违规问题,请即刻联系我们删除,未经允许禁止复制转载!感谢...
更多人喜欢

在线
客服

在线客服服务时间:9:00-21:00

客服
热线

13227777380
7*24小时客服服务热线

客服
微信

扫一扫微信咨询
顶部