页面地址:https://www.baidu.com/baidu.php?sc.K000000fJeHuq9k18PvSMTqPVJOr4I_DzW-zvs73x61JUfvts0nEt5ScVepMPVZhii51-vXAnK5ygXHOoDeRyTaegBhq5RupmOFY8B2XObNQ9JDKLPXmmfah8AlxGJHv7tdQ7-Vjx3SbeWelvtiUJGITFu5UghTjGHNSnCuGa2POhm6TGf.DR_iwt5-8vc69JsTrajE6CpXyPvap7QDpIrXPhBh55X1BsutT5y5ZGmLX5H8ovUqLZGtx2E_vUtMW_vUqdxgKfYt_QrMAzONDkAhWwl32AM-YG8x6Y_f33X_IH8jZ-Wmkst8ER_HAOuugb_vUrgWzLp-9h9merzEx3J0.U1YY0ZDqdS2LEsKspynqnfKY5TM8vqog3oXO0A-V5HczPfKM5gNbXWD0Iybqmh7GuZN_UfKspyfqP0KWpyfqrHn0UgfqnH0kPdtknjD4g1DsnHPxn1msnfKopHYs0ZFY5HcvP6K-pyfqnHfznNtznH04n-tznj63nNtznWDvn0KBpHYznjf0UynqP1nvnjRYrHTLg1T1PW0dPjb3n7tzP1nkPWc4nW0vg100TgKGujYs0Z7Wpyfqn0KzuLw9u1Ys0A7B5HKxn0K-ThTqnfKsTjY1nH03P1TkrjcY0A4vTjYsQW0snj0snj0s0AdYTjYs0AwbUL0qn0KzpWYs0Aw-IWdsmsKhIjYs0ZKC5H00ULnqn0KBI1Yv0A4Y5H00TLCq0ZwdT1YknWRsPjT4rHbYPW0dn1Tdnj63n0Kzug7Y5HDdnWnLnWm3n1D1nj00Tv-b5HbkujRsnyn1nj0snWbLPHT0mLPV5H6LPH0vrDfLrD7DnjR1PYn0mynqnfKsUWYs0Z7VIjYs0Z7VT1Ys0ZGY5H00UyPxuMFEUHYsg1Kxn7ts0Aw9UMNBuNqsUA78pyw15HKxn7tsg100TA7Ygvu_myTqn0Kbmv-b5H00ugwGujYVnfK9TLKWm1Ys0ZNspy4Wm1Ys0Z7VuWYs0AuWIgfqn0KhXh6qn0Khmgfqn0KlTAkdT1Ys0A7buhk9u1Yk0Akhm1Ys0APzm1YkPWcLns&ck=1491.15.78.260.492.350.141.458&shh=www.baidu.com&sht=98012088_3_dg&us=4.0.1.0.17.6376.0&ie=utf-8&f=8&ch=14&tn=98012088_3_dg&wd=%E7%A7%9F%E6%88%BF&oq=%E7%A7%9F%E6%88%BF&rqlang=cn&bc=110101|Cn5lxFfhSDpa3yYFHJoKAg==&PGTID=0d3090a7-0000-4794-2709-75761993ea05&local=4&apptype=0&key=&pubid=30945153&trackkey=33244024629037_fc9df3cf-eb54-48f0-b158-dec9bf6a436c_20180415013130_1523727090906&fcinfotype=gz]点击查看[/url]
我想采集信息如下图:
我想采集页面上图的两处信息,信息包括样式、图片、连接、文字
请问在编辑正文字段时选用什么规则,规则方式怎么编写
添加3个字段,1个抓取描述,1个抓取图片,1个字段组合前两个
描述xpath:
- /html/body/div[4]/div[3]/div[1]/div[1]/ul/li[2]/span[2]
图片xpath:
- //*[@id="housePicList"]
这个采集58同城数据的兄弟,搞定了吗,我试了采集不了啊 相关知识点: 字段 我想 标签
- 1金融投资/证券理财网站建设方案
- 2163K网站系统浏览器中的网站图标(favicon.ico图标)设置说明
- 3蓝天采集器请问发布方式的自定义插件是使用方法
- 4蓝天采集器只能翻译一个字段。
- 5蓝天采集器发布设置里绑定本地cms程序提示错误
- 6蓝天采集器Zblog怎么自动发布?
- 7蓝天采集器如何采集百度搜索结果教程
- 8emlog6.0在线安装程序教程
- 9蓝天采集器内容页数据处理问题
- 10163K网站系统QQ登录配置教程
- 11阿里云linux系统服务器CentOS7.6安装宝塔教程
- 12蓝天采集器怎么才能循环采集某个页面的相同值
- 13蓝天采集器采集两个就停下不动了
- 14PbootCMS安装蓝天采集器教程
- 15163K网站系统S3新版首页内容设置说明
- 16蓝天采集器后台设置了邮件发送地址点测试报错
- 17蓝天采集器测试的时候没有问题。真正采集出现这种问题
- 18蓝天采集器2.0版本后不能自动采集了
- 19蓝天采集器开启自动采集总是莫名其妙自己停止了
- 20极致cms管理员后台左侧菜单不显示了如何恢复操作教程
-
蓝天采集器什么时候能自己用的一些小问···
第一个就是自动采集!和代码采集,在我这里都不能用!! 第二个就是在 采集设置内容页网址 与 获取内容均能看到源码!好让我们知道哪里出错了! 第三个数据库链接信息可以保存一下,后续直接调用!这个也很好实现 第四个 看在我这么提议的份上写个em···
-
蓝天采集器蓝天采集好像不支持伪原创哦
蓝天采集好像不支持伪原创哦例如以前可以让采集的数据自动添加文字 加到文章的前面或者后面现在好像不可以哦 是的,还没有伪原创功能,添加文字可以用字段》字段组合来实现
-
蓝天采集器采集微信公众号操作教程
微信公众号是一个活跃量非常高的信息流平台,许多的站长都有自己的公众号,在上面发布了许多的信息,由于平台没有导出的功能,发布的信息比较多,手动复制也不太现实,所以呢我们就需要用一些工具到进行导出到我们需要的平台上面。微信公众号的内容有2个途径···
-
SEO学习向导流程适合SEO零基础入···
如何快速的学习SEO学习精髓:努力,勤奋,多思考;快就是慢,慢就是快;人生·工作的结果=思维方式×热情×能力。学习SEO的几个过程:准备工作:时间方面(每天不底于3小时来学习)实践方面(必备建站工作)实践前的准备:
-
蓝天采集器如何采集文章中的附件?
如何采集文章中的附件? 没看到附件本地化 暂时不行,只能下载图片