蓝天采集器内容允许匹配多个元素循环入库教程

2020-04-27 938 19 编辑:蜀戎seo 来源:蜀戎网

我们平时在采集一些论坛或者贴吧,问答平台等都会有多段内容,在写采集规则的时候我们就要换一种操作方法,利用我们的循环入库。

我们就以http://bbs.skycaiji.com/forum.php?mod=viewthread&tid=849为例;

来获取获取它的主题内容和回复内容。

查看源代码,分析得到:

主题内容开始字符串为id="postmessage_2055"> 因为不同的帖子,ID不同,

所以我们把2055这个数字设置为(*)通配符.

循环入库规则

即开头字符串为id="postmessage_(*)">

结尾字符串为</td></tr></table>

然后勾选下图中的循环匹配,即可实现主题和回复的内容采集。

规则设置

出现效果图入下:(当然越可以选择拼接为文本)

循环入库效果

到这里我们的蓝天采集器循环入库就完成了。拼接文本是入库到一个字段里面,根据自己的需要来设置。

相关知识点: 蓝天采集器 循环入库
本站文章均为蜀戎网络摘自权威资料,书籍,或网络原创文章,如有版权纠纷或者违规问题,请即刻联系我们删除,未经允许禁止复制转载!感谢...
更多人喜欢

在线
客服

在线客服服务时间:9:00-21:00

客服
热线

13227777380
7*24小时客服服务热线

客服
微信

扫一扫微信咨询
顶部