disucz网站使用人数也是非常的多,作为一款论坛系统发帖回帖都很便捷。disucz网站的内容采集都比较简答,但是如果想把回帖评论信息也一并采集了这个时候问题来了,该如何来操作呢,今天蜀戎网给大家分析学习一下。
https:// www . hostloc.com /thread-707617-1-1.html
我们以此站为例,采集回帖评论;
查看源代码:
我们查找循环的标签发现:
id="postmessage 标签多次出现循环,分析得知这就是我们需要采集的标签。
id="postmessage_8668384">后面的数字,每一条回复内容都会不同,所以我们用通配符来代替。规则直接写
id="postmessage_(*)">[内容1]</td></tr></table>
最后点击测试最终展示效果
因为回帖评论信息是多个,所以我们要勾选上循环匹配,当然了我们还可以吧我们采集回来的数据进行拼接为文本格式插入到我们的内容中去,然后利用的字段组合即可。以上就是disucz站的回帖评论信息采集规则教程,回帖评论信息所有的网站规则都是通用的,原理也是一样,所有学会这里几乎都OK的!还有不明白的底部下方留言解答。
相关知识点: disucz回帖 蓝天采集器 循序匹配- 1蓝天采集器本地安装操作教程-蜀戎cms网录制
- 2蓝天采集器https的网站不支持加载云平台
- 3如何获取当前页面cookie填写在蓝天采集器里面
- 4网站的外链资源圈如何来建立
- 5蓝天采集器自动采集插件在米拓5.3.19下无法采集
- 6蓝天采集器列表页即内容页,如何抓取table表格,且是有分页的?
- 7pbootcms升级到3.0.3+最新版文章点击后跳转首页解决办法
- 8蓝天采集器怎么发布规则到云平台
- 9pbootcms常见的导航高亮下拉标签设置教程
- 10蓝天采集器采集中断,自动采集不运行
- 11蓝天采集器通过 Tor 代理 如何绕过机器人检测
- 12七牛云加速域名开启https教程
- 13蓝天采集器1条已采集起始网址被过滤
- 14蓝天采集器无法获取post方式获得的列表页面
- 15MetInfo企业网站管理系统(米拓cms)火车头采集入库使用教程
- 16163K网站系统图片系统+七牛云存储配置教程
- 17PbootCMS内容详情页自定义模板文件
- 18蓝天采集器IP代理使用方法
- 19蓝天采集器不算BUG的BUG(发布方式为数据库插入成功却提示失败)
- 20163K系统S2版升级S3前注意事项和准备工作
-
蓝天采集器内容匹配换行问题
内容匹配出来都是一行,有没有办法加个换行 有换行功能就好多了 都是一行?应该是抓取的数据就是一行显示的吧? 可以用正则替换一下
-
PbootCMS文章通过keywor···
有时客户想根据keywords关键字来做匹配在文章详情页里显示相关内容,同样带有一样的关键字的。解决办法通过翻看手册发现有个通过tags来做匹配的方法,然而此次网站不用tags,那么直接二开下程序代码关键位置即可实现。打开ppshomec···
-
蓝天采集器skycaijiv2.3.···
蓝天采集器v2.3更新文档1、修复自动采集死循环卡死问题,cli命令模式php路径问题(linux中自动识别php路径需要关闭目录跨站保护)2、加强自动采集触发的安全性,优化自动采集性能减少系统消耗3、加入函数插件,可用于数据处理的使用函数···
-
PbootCMS前台和后台搜索中带字···
打开coreunctionhelper.php,在下图中圆圈位置里增加需要允许的符号,这里是全局的搜索关键词匹配。 ···
-
163k地方门户系统安装操作教程
环境:WIN2012/2016数据中心中文版系统,IIS7.5或更高 ,SQL2008R2数据库,.NET4.6或4.7服务器要开放的TCP端口: 80(http) 443(https) 7070(门户程序自动升级) 3389(远程桌面)建···