页面地址:https://www.baidu.com/baidu.php?sc.K000000fJeHuq9k18PvSMTqPVJOr4I_DzW-zvs73x61JUfvts0nEt5ScVepMPVZhii51-vXAnK5ygXHOoDeRyTaegBhq5RupmOFY8B2XObNQ9JDKLPXmmfah8AlxGJHv7tdQ7-Vjx3SbeWelvtiUJGITFu5UghTjGHNSnCuGa2POhm6TGf.DR_iwt5-8vc69JsTrajE6CpXyPvap7QDpIrXPhBh55X1BsutT5y5ZGmLX5H8ovUqLZGtx2E_vUtMW_vUqdxgKfYt_QrMAzONDkAhWwl32AM-YG8x6Y_f33X_IH8jZ-Wmkst8ER_HAOuugb_vUrgWzLp-9h9merzEx3J0.U1YY0ZDqdS2LEsKspynqnfKY5TM8vqog3oXO0A-V5HczPfKM5gNbXWD0Iybqmh7GuZN_UfKspyfqP0KWpyfqrHn0UgfqnH0kPdtknjD4g1DsnHPxn1msnfKopHYs0ZFY5HcvP6K-pyfqnHfznNtznH04n-tznj63nNtznWDvn0KBpHYznjf0UynqP1nvnjRYrHTLg1T1PW0dPjb3n7tzP1nkPWc4nW0vg100TgKGujYs0Z7Wpyfqn0KzuLw9u1Ys0A7B5HKxn0K-ThTqnfKsTjY1nH03P1TkrjcY0A4vTjYsQW0snj0snj0s0AdYTjYs0AwbUL0qn0KzpWYs0Aw-IWdsmsKhIjYs0ZKC5H00ULnqn0KBI1Yv0A4Y5H00TLCq0ZwdT1YknWRsPjT4rHbYPW0dn1Tdnj63n0Kzug7Y5HDdnWnLnWm3n1D1nj00Tv-b5HbkujRsnyn1nj0snWbLPHT0mLPV5H6LPH0vrDfLrD7DnjR1PYn0mynqnfKsUWYs0Z7VIjYs0Z7VT1Ys0ZGY5H00UyPxuMFEUHYsg1Kxn7ts0Aw9UMNBuNqsUA78pyw15HKxn7tsg100TA7Ygvu_myTqn0Kbmv-b5H00ugwGujYVnfK9TLKWm1Ys0ZNspy4Wm1Ys0Z7VuWYs0AuWIgfqn0KhXh6qn0Khmgfqn0KlTAkdT1Ys0A7buhk9u1Yk0Akhm1Ys0APzm1YkPWcLns&ck=1491.15.78.260.492.350.141.458&shh=www.baidu.com&sht=98012088_3_dg&us=4.0.1.0.17.6376.0&ie=utf-8&f=8&ch=14&tn=98012088_3_dg&wd=%E7%A7%9F%E6%88%BF&oq=%E7%A7%9F%E6%88%BF&rqlang=cn&bc=110101|Cn5lxFfhSDpa3yYFHJoKAg==&PGTID=0d3090a7-0000-4794-2709-75761993ea05&local=4&apptype=0&key=&pubid=30945153&trackkey=33244024629037_fc9df3cf-eb54-48f0-b158-dec9bf6a436c_20180415013130_1523727090906&fcinfotype=gz]点击查看[/url]
我想采集信息如下图:
我想采集页面上图的两处信息,信息包括样式、图片、连接、文字
请问在编辑正文字段时选用什么规则,规则方式怎么编写
添加3个字段,1个抓取描述,1个抓取图片,1个字段组合前两个
描述xpath:
- /html/body/div[4]/div[3]/div[1]/div[1]/ul/li[2]/span[2]
图片xpath:
- //*[@id="housePicList"]
这个采集58同城数据的兄弟,搞定了吗,我试了采集不了啊 相关知识点: 字段 我想 标签
- 1163K网站系统X12(20191014)版本自动升级额外事项
- 2蓝天采集器下载图片本地化操作设置
- 3pbootcms火车头采集器免登录发布使用教程
- 4163K网站系统网站系统环境配置和建站教程
- 5营销门户网站建设方案
- 6蓝天采集器安装出问题 显示版本问题
- 7163K网站系统微信支付配置教程(S版)
- 8pbootcms常见的导航高亮下拉标签设置教程
- 9163K网站系统网站客服的QQ在线状态设置说明
- 10蓝天采集器关于列表页当作内容页采集的疑问
- 11十万外链的网站打造策略
- 12蓝天采集器能否针对图片进行,其他保存路径设置处理
- 13蓝天采集器[求助]请问采集内容页短路径如何采集?
- 14蓝天采集器exception 'Requests_Exception' with message 'cURL error 60: SSL certificate p...
- 15极致cms管理员后台左侧菜单不显示了如何恢复操作教程
- 16蓝天采集器拼接网址问题--卡壳了
- 17163K网站系统X10_V1升级教程
- 18狂野小说cms白色优美-手机模版(wap)和蓝色简约版手机模板免费分享
- 19迅睿CMS火车头采集免登录入库接口和蓝天采集器入库使用教程
- 20企业网站关键词搜索引擎优化seo操作教程
-
火车头免登录发布模块pbootcms···
蜀戎网今天给大家带来的火车头免登录发布模块和入库插件,一直以为pbootcms都是用的是web发布模块,每次都需要去登录非常的麻烦,群里小伙伴也有需要的所以就干脆写了一下如下图;以上呢是pbootcms的后台所有字段参数,已经是非常的详细了···
-
蜀戎seo教你分分钟破解eval(f···
相信许多的小伙伴看到eval的加密过的代码就很懵了,明明知道这块是内容,但是无法读取出来,无从下手。当然了之所有要这样操作呢也是为了不让别人看到自己js里面的内容,所以做一个小小的加密。对于小白来说比较困难了,但是对于一个php站长来说那就···
-
蓝天采集器2.0版本后不能自动采集了
1.3版本还可以自动采集,安装了2.0版本后就不能自动采集了,只能每次保存采集设置才能自动采集一会,然后就没有然后了,无论触发或后台都次保存后就自动采集一会,后面时间都不会自动了。是不是程序漏洞,帮忙看看 你看看网址是不是包含“index···
-
蓝天采集器管理员可以加个功能不
可以在发布项加个模拟发布的功能吗?可以自定义发布参数字段,拼接采集后的结果,模拟发布 其实直接写好规则,测试发布就可以看到效果了 模拟发布不好做,因为和cms打通是单向的,发布后数据就已经在cms中了,删除只能登陆cms后台操作
-
狂雨小说CMS模版下载与设置
首先要注册联盟帐号进入后台-系统扩展-模版市场选择要下载的模版-点击下载模版下载完成进入模版管理选择下载好的模版点击设为默认web为电脑模版 wap为手机模版