火车头采集国外英文网站教程分享

2020-01-01 1102 19 编辑:蜀戎SEO 来源:蜀戎网络

此文只是作为分析测试,如有侵犯权限联系我们删除。

源站:www.unionrepair.com 由于源站服务器在国外所以打开速度比较慢,源站是一个shop商城,我们今天就测试采集产品价格,标题以及内容。

第一步:添加任务(名称随意)采集网址规则

火车头网址规则

起始网址:意思是从那里开始采集(也就是打开的意思);

多级网址获取:这里就是我们采集产品的网址链接;

网址提取方式

以上是提取页面链接地址规则:

TH1}L_LD@%QM7(8}S@5UBWM.png

以上是选定区域网址:

开始:<div class="ty-tabs cm-j-tabs cm-j-tabs-disable-convertation clearfix">

结束:<div class="ty-mainbox-container clearfix about-company-desc">

网址提取方式:<div class="ty-grid-list__image"> <a href="https://参数"

网址提取开始

网址的链接提取规则我们就配置好了,由于网站是外国的所以我们别忘记把网站的cookie填写上。

第二步:采集内容规则

标题:<meta property="og:title" content=" " />

价格:<input type="hidden" name="pda_send_dataprice" value=" " />

内容:<code class="xml plain" style="font-size: 13px; white-space: pre; padding: 0px !important; font-fam

相关知识点: 火车头采集规则
本站文章均为蜀戎网络摘自权威资料,书籍,或网络原创文章,如有版权纠纷或者违规问题,请即刻联系我们删除,未经允许禁止复制转载!感谢...

在线
客服

在线客服服务时间:9:00-21:00

客服
热线

13227777380
7*24小时客服服务热线

客服
微信

扫一扫微信咨询
顶部