我想取的是 所有<div class="listchannel"> 下的
<div class="imagechannel"> 里的
<a target="blank" href="里面的 href = URL和
<img src=里面的图片地址和 title 里面的中文
但如果用
Xpath 匹配//*[@id="videobox"] 的话------- 他会不停地转,
如果用
<div class="imagechannel">[内容1] </div>-------------只能得到 一条信息 但里面还有19个<div class="listchannel"> 里面的信息没有拿到
请问怎么写规则
编辑字段 开启 允许匹配多个节点 试试
- 1金融投资/证券理财网站建设方案
- 2蓝天采集器无法抓取内容页网址为相对地址的列表
- 3蓝天采集器有没有可能增加这么一个“采集筛选”的功能?
- 4蓝天采集器exception 'Requests_Exception' with message 'cURL error 60: SSL certificate p...
- 5蓝天采集器内容页只能采集一页?
- 6蓝天采集器想爬去的页面 需要点击开始后才能出结果 怎么爬取
- 7json采集功能点说明
- 8蓝天采集器发布问题
- 9蓝天采集器三级网页采集方式?
- 10影视听书系统苹果cmsv10安装操作教程
- 11蓝天采集器邮箱发出去的文字都是乱码
- 12极致cms管理员后台左侧菜单不显示了如何恢复操作教程
- 13蓝天采集器伪静态后台有问题
- 14蓝天采集器本地安装操作教程-蜀戎cms网录制
- 15蓝天采集器又有新的问题!版主来哈。关于采集的
- 16蓝天采集器请教一下,如何采集js里的数据?
- 17SEO学习向导流程适合SEO零基础入门站长
- 18蓝天采集器感谢一下skycaiji。便利各路苦逼站长SEO
- 19蓝天采集器出现无法加载数据库驱动什么情况!求解决!!!!
- 20蓝天采集器求助大神,这个规则怎么写
-
蓝天采集器IP代理使用方法
请问 我用IP+端口 还有http代理可行, 但不能用socks 请问怎么使用呢 还有怎么批量添加ip, 抓取失败的话 怎么看是哪一个代理ip导致的呢 今天在服务器上搞了 tor代理,但只能socks做代理目前卡在这一关 ip代理还不完···
-
各大平台站长推送平台简介
举例:百度站长平台验证1、登录百度站长平台地址: https://ziyuan.baidu.com/site/index 登录您的百度账号。(没有账号需注册)2 登录后选择“站点管理”3 点击“添加网站”然后输入你网站的地址,点击下一步。4···
-
蓝天采集器怎么把采集得到的图片下载在···
暂不支持直接下载图片链接,必须要放在 img标签里才能识别 比如:<img src="图片网址">
-
蓝天采集器这是什么问题
本帖最后由 猪头妹很2 于 2018-4-26 02:08 编辑 [p=120, null, left]我测试采集都没有问题,但是点采集就错误?? [p=120, null, left][size=100px] 页面错误!请稍后再试···
-
蓝天采集器登录密码忘记了找回密码的2···
蓝天采集器登录的时候把密码忘记了就进入不了后台,这个时候呢处理办法有2个;如下图点击找回密码---填写上我们注册时候填写的那个邮箱账号。点击下一步:如果我们在后台配置了邮箱登录呢 就会收到一个验证激活码,如果没有呢这个办法就不成···