我们平时在采集一些论坛或者贴吧,问答平台等都会有多段内容,在写采集规则的时候我们就要换一种操作方法,利用我们的循环入库。
我们就以http://bbs.skycaiji.com/forum.php?mod=viewthread&tid=849为例;
来获取获取它的主题内容和回复内容。
查看源代码,分析得到:
主题内容开始字符串为id="postmessage_2055"> 因为不同的帖子,ID不同,
所以我们把2055这个数字设置为(*)通配符.
即开头字符串为id="postmessage_(*)">
结尾字符串为</td></tr></table>
然后勾选下图中的循环匹配,即可实现主题和回复的内容采集。
出现效果图入下:(当然越可以选择拼接为文本)
到这里我们的蓝天采集器循环入库就完成了。拼接文本是入库到一个字段里面,根据自己的需要来设置。
相关知识点: 蓝天采集器 循环入库- 1蓝天采集器蓝天采集器安装好后仍提示安装
- 2蓝天采集器请管理员考虑添加自动登陆功能
- 3蓝天采集器咨询开发Unicode编码解码
- 4手把手教你做PbootCMS自动替换图片地址为七牛云cdn镜像链接操作教程
- 5Discuz门户蓝天采集器入库字段(发布插件)都有哪些
- 6蓝天采集器有没有可能增加这么一个“采集筛选”的功能?
- 7蓝天采集器这种页面不能采集吗
- 8pbootcms蓝天采集器发布插件制作参数教程
- 9PbootCMS前台和后台搜索中带字符搜不到结果,例如·:
- 10蓝天采集器发布到本地数据库失败
- 11企业网站关键词搜索引擎优化seo操作教程
- 12蓝天采集器求助 发布设置中WordPress怎么检测不到?
- 13蓝天采集器内容页指定关键词办法参考
- 14163K网站系统短信通知配置教程(S版)
- 15蓝天采集器dede5.7发布不发标题
- 16Typecho1.1轻博客在线安装操作教程
- 17阿里云windows服务器买了单独的云盘如何挂载数据盘在服务器上面教程
- 18蓝天采集器发布到mysql出错
- 19给PbootCMS增加个换行格式化标签br=1
- 20pbootcms首页只调用推荐的文章的教程
-
pbootcms类型站点怎么查看图片···
1、先在图片或相应的元素上 点击 右键-属性 可以看到路径、大小、颜色,图片同名同格式用ftp覆盖。查看元素的颜色,然后修改相应的CSS。2、如果上个方法看不到,在图片或相应的元素上 点击 ···
-
蓝天采集器自动采集具体怎么用呢,需要···
如题 不需要,保存设置后就会自动运行,js触发模式才需要在html代码里加脚本触发
-
蓝天采集器咨询开发Unicode编码···
数据处理(通用)-工具箱 相对应的代码文件是哪个呢?由于采集JSON数据,里面中文被Unicode编码了 现在想在工具箱位置 添加个Unicode编码解码功能.请教下开发具体对应文件代码是哪个?技术员能加上这个功能就更完美了 技术放假还···
-
蓝天采集器数据库插入数据时候的问题
问题如图 每次都失败还是个例?没有抓取到数据或者发布设置中数据库没有绑定字段 admin 发表于 2018-4-10 11:19 每次都失败还是个例?没有抓取到数据或者发布设置中数据库没有绑定字段 现在每个任务都是这样数据库绑定了,对···
-
蓝天采集器如何加大采集数量!!!设置···
请问大神们,每次只能采集1000数据,如何加大采集数量,然后不懂我自动采集是不是设置的有问题?采集完1000数据后,要过来点击才会在开始运行。 任务中是否设置了采集数量 采集中断了是web服务器有运行时间限制,要修改下服务器的超时时···