蓝天采集器json分类信息采集规则教程

2020-08-15 1648 19 编辑:蜀戎seo 来源:蜀戎网

我们在采集数据的时候经常会遇到,页面上没有我们想要的内容都隐藏起来了。也可以说是ajx传输在页面上的,这个时候我们采集的规则就要变动一下。

http://shili.skycaiji.com/info/json/house

{"list":[{"title":"-开头------结尾-"}]}

json数组

起始页:

起始页链接

起始页的链接直接输入我们需要采集的页面就可以了,如果有分页的话直接使用多页进行匹配。

内容页这里规则就有点区别了,我们需要用到json的字符串。

list.*.url

内容链接规则

点击测试一下

链接展示

链接全部获取到了,是不是很简单呢;相对于正则或者xpath来说更加的便捷,直接用字符串就全部匹配了,接下来我们开始写获取内容字段。

标题字段演示

标题:data.title
地址:data.address
均价:data.price
户型:data.huxing
标签:data.tags

规则其实和刚才我们上一步内容链接是一样的直接用字符串获取;写好以后点击保存;点击测试效果如下。

获取内容结果页

好了,以上教程由蜀戎网独家制作完成,禁止转载复制!如还有不明白的欢迎下方留言。

相关知识点: json分类信息采集规则 json字符串
本站文章均为蜀戎网络摘自权威资料,书籍,或网络原创文章,如有版权纠纷或者违规问题,请即刻联系我们删除,未经允许禁止复制转载!感谢...
更多人喜欢

在线
客服

在线客服服务时间:9:00-21:00

客服
热线

13227777380
7*24小时客服服务热线

客服
微信

扫一扫微信咨询
顶部