此文只是作为分析测试,如有侵犯权限联系我们删除。
源站:www.unionrepair.com 由于源站服务器在国外所以打开速度比较慢,源站是一个shop商城,我们今天就测试采集产品价格,标题以及内容。
第一步:添加任务(名称随意)采集网址规则
起始网址:意思是从那里开始采集(也就是打开的意思);
多级网址获取:这里就是我们采集产品的网址链接;
以上是提取页面链接地址规则:
以上是选定区域网址:
开始:<
div
class
=
"ty-tabs cm-j-tabs cm-j-tabs-disable-convertation clearfix"
>
结束:
<
div
class
=
"ty-mainbox-container clearfix about-company-desc"
>
网址提取方式:
<
div
class
=
"ty-grid-list__image"
> <
a
href
=
"https://参数"
>
网址的链接提取规则我们就配置好了,由于网站是外国的所以我们别忘记把网站的cookie填写上。
第二步:采集内容规则
标题:
<
meta
property
=
"og:title"
content
=
" "
/>
价格:<
input
type
=
"hidden"
name
=
"pda_send_dataprice"
value
=
" "
/>
内容:<code class="xml plain" style="font-size: 13px; white-space: pre; padding: 0px !important; font-fam
相关知识点: 火车头采集规则- 1163K网站系统网站客服的QQ在线状态设置说明
- 2蓝天采集器蓝天采集好像不支持伪原创哦
- 3蓝天采集器采集中断、自动采集无效、图片下载不了,解决方法!
- 4Xpath不固定元素列表规则写法
- 5pbootcms栏目内容-详情页设置输出html
- 6如何添加阿里云服务器安全组规则
- 7蓝天采集器想爬去的页面 需要点击开始后才能出结果 怎么爬取
- 8营销门户网站建设方案
- 9蓝天采集器采集重复: 被采集的内容页网址会自动变导致重复
- 10PbootCMS性能优化研究之网页响应速度
- 11蓝天采集器关于列表页当作内容页采集的疑问
- 12蓝天采集器dede5.7发布不发标题
- 13蓝天采集器什么时候能自己用的一些小问题
- 14163K系统S2版升级S3前注意事项和准备工作
- 15蓝天采集器如何加大采集数量!!!设置自动采集
- 16Discuz! Q宝塔面板在线安装操作教程
- 17蓝天采集器发布设置问题
- 18dedecms转pbootcms常见标签转换教程
- 19蓝天采集器采集两个就停下不动了
- 20蓝天采集器发布问题
-
linux系统centos7安装ch···
linux系统不像我们windows系统那样桌面化手动点击操作,蜀戎网络给大家讲一下centos7系列如何安装chrome浏览器。据说默认是自带了火狐浏览器的,但是作为一个程序员来说火狐还是没有chrome浏览器那么强大。第一步通过ssl远···
-
蓝天采集器采集两个就停下不动了
手动采集两个就不动了,自动采集也没反应,测试规则和发布都是成功的,查看日志没有当天错误记录,不知道啥情况操作系统 Linux 2.6.32-696.23.1.el6.x86_64运行环境 nginx/1.12.2数据库 m···
-
163K网站系统微信支付申请设置说明···
注意 需要同时开通网站的微信登陆功能 可参考说明: http://fuwu.163k.com/thread-41844-1-1.html 注意 网站手机版 必须正常开启 (管理员后台 手机版配置 是否开启手机版是 开启状态 ) 支付···
-
蓝天采集器发布到数据库失败
设置成发布到数据库,,但是一直失败,求大神指导 开发工具》错误日志 看看有什么错误提示,这样看不出来 查看一下你的字段名称可能是全英文的 已经解决了,是因为绑定表结构的地方,,把前面设置数据库用户密码的地方不对,,每次保存完,,再点···
-
蓝天采集器建议:下个版本能否开发将“···
用这个试试,可以导入其他任务的发布设置 暂时没有导出,后期完善