此文只是作为分析测试,如有侵犯权限联系我们删除。
源站:www.unionrepair.com 由于源站服务器在国外所以打开速度比较慢,源站是一个shop商城,我们今天就测试采集产品价格,标题以及内容。
第一步:添加任务(名称随意)采集网址规则
起始网址:意思是从那里开始采集(也就是打开的意思);
多级网址获取:这里就是我们采集产品的网址链接;
以上是提取页面链接地址规则:
以上是选定区域网址:
开始:<
div
class
=
"ty-tabs cm-j-tabs cm-j-tabs-disable-convertation clearfix"
>
结束:
<
div
class
=
"ty-mainbox-container clearfix about-company-desc"
>
网址提取方式:
<
div
class
=
"ty-grid-list__image"
> <
a
href
=
"https://参数"
>
网址的链接提取规则我们就配置好了,由于网站是外国的所以我们别忘记把网站的cookie填写上。
第二步:采集内容规则
标题:
<
meta
property
=
"og:title"
content
=
" "
/>
价格:<
input
type
=
"hidden"
name
=
"pda_send_dataprice"
value
=
" "
/>
内容:<code class="xml plain" style="font-size: 13px; white-space: pre; padding: 0px !important; font-fam
相关知识点: 火车头采集规则- 1Xpath不固定元素列表规则写法
- 2蓝天采集器图片本地化问题,请问一下站长
- 3163K网站系统公众号模板消息配置教程
- 4163K网站系统同一服务器多个网站系统配置自动升级教程
- 5蓝天采集器BUG反馈
- 6蓝天采集器百度知道问题列表页测试抓取获取不到问题列表?
- 7蓝天采集器保存到本地文档excel后面后缀会变成几位随机字母
- 8zblog蓝天采集器发布插件带评论置顶标签
- 9蓝天采集器建议增加实用功能
- 10蓝天采集器请问 这个json数组如何入库呢?
- 11蓝天采集器起始网址无法通过POST方式批量获取列表页
- 12163K网站系统视频系统详解+七牛远程附件配置教程
- 13蓝天采集器采集出现代码,什么意思
- 14蓝天采集器安装好后登录提示这个
- 15蓝天采集器CentOS 7 下搭建Tor代理服务器
- 16蓝天采集器怎么样采集商品首图
- 17PbootCMS内容详情页自定义模板文件
- 18蜀戎seo教你分分钟破解eval(function(p,a,c,k,e,d){}))的JavaScript代码
- 19蓝天采集器内容页指定关键词办法参考
- 20蓝天采集器关于判断
-
蓝天采集器BUG反馈
NGINX环境中,预先配置伪静态再安装采集程序报错,需要先安装采集程序,再配置伪静态。 谢谢反馈,该程序基本上不强求伪静态的,除了发布为api接口(也可以用动态的)
-
蓝天采集器图片本地化问题,请问一下站···
已经提取出图片地址 发布方式 是直接提交到数据库了,请问一下应该怎么设置,能先把图片本地化,然后再提交数据库。 暂时还不支持链接形式下载图片,可以参考下http://bbs.skycaiji.com/forum.php?mod=vie···
-
迅睿CMS文章火车头采集器使用教程说···
迅睿CMS文章用火车头采集器使用教程:1、先吧api文件里面的数据库信息填写好,如下图所示:这里的数据库信息直接填写网站的数据库信息,token是密匙,这个可以随意填写。2、填写好数据库信息,吧api.php文件上传网站根目录。3、打开火车···
-
蓝天采集器BUG反馈:标题排重无法正···
治标的办法:使用网址排重,对需要再次采集的网址在采集记录里删除掉。
-
多语言建站看这里:PbootCMS多···
一、如何搭建多语言站?多语言/区域建站用于使用同一个后台建立多语言网站。1、使用步骤1)在后台"系统管理>数据区域"添加相应的区域,具体参考默认区域;2)将多语言的模板放入模板目录,不同语言的模板均放在templa···