https://movie.douban.com/j/search_subjects?type=movie&tag=%E6%9C%80%E6%96%B0&page_limit=500&page_start=0起始页网址是上面这个链接,然后在内容页网址配置规则就是无法获取链接,各种办法都试过就是不行,不知道是不能识别这种链接还是需要什么特殊方式操作,后面的规则都已经搞定,就差这一步 自能自动提取html的a标签连接,你这种要写提取规则
admin 发表于 2018-4-26 19:40
自能自动提取html的a标签连接,你这种要写提取规则
能具体讲讲怎么写吗,我设置了多种方式测试都没成功 提取网址规则:
- "id":"[内容1]"
- https://movie.douban.com/subject/[内容1]/
相关知识点: 规则 网址 链接
- 1蓝天采集器给作者一个网站
- 2蓝天采集器采集报错500 Internal Server Error
- 3蓝天采集器采集网址总是提示“页面为空”是怎么回事?
- 4蓝天采集器测试发布问题
- 5蓝天采集器只能手机访问的站点,怎么采集?
- 6蓝天采集器PHP7的版本什么时候出
- 7蓝天采集器年后上线新版本,敬请期待!
- 8蓝天采集器提示信息
- 9蓝天采集器怎么样采集商品首图
- 10pbootcms首页只调用推荐的文章的教程
- 11蓝天采集器这个自增主键在哪设置呀。
- 12迅睿CMS文章火车头采集器使用教程说明
- 13蓝天采集器关键json采集的问题
- 14蓝天采集器求教繁体和简体,中文和英文的转换问题
- 15狂雨小说cms伪静态设置
- 16蓝天采集器WordPress子比主题Zibll 版本:5.7.1入库插件使用说明
- 17蓝天采集器点击安装跳到/.php?m=install&c=index&a=index
- 18蓝天采集器需要多表发布,ID关联,能获取上一个表的自增ID的功能
- 19蓝天采集器chrome提取的xpath规则可以通过调试却抓不到数
- 20蓝天采集器起始网址无法通过POST方式批量获取列表页
-
蓝天采集器&的问题
在测试的时候可以正常成功的获取到分页的数据 但是在正式执行采集任务的时候则是这样 源码中的分页码网址不合规范,“=”导致无法识别 网址规则photos/(?<content1>d+?)/al···
-
蓝天采集器采集器取消了自动补全网址,···
之前设置了补全网址,然后改了不补全网址了,但是还是自动补全了,用内容替换页去不掉网址,有人知道怎么回事吗? 嗯,这是个bug 暂时解决》内容替换:<a href="([^"]+)"复制代码<a h···
-
蓝天采集器本地安装操作教程-蜀戎cm···
b站直达:https://www.bilibili.com/video/av754472399课件下载地址:百度云链接: https://pan.baidu.com/s/1MUHS-nevYR1_KijCyqoc_A 提取码: bzie蓝奏···
-
pbootcms文章如何新增自定义字···
很多时候我们在发布产品或者新闻资讯的时候,默认的字段是无法满足我们所发内容的需求,这个时候呢就需要新增加一些自定义字段出来,话不多说给大家分享下。1、文章、产品、案例、招聘、专题等模型新增自定义字段操作如下:全局设置----模型字段----···
-
蓝天采集器如何采集百度搜索结果教程
相信许多的站长朋友们有时候会需要采集百度搜索出来的信息,直接采集是获取不到任何的链接信息的。下面就跟着蜀戎网络一起来学习一下,本教程只作为蓝天采集器分析测试。首页在www.baidu.com搜索我们想要采集的信息,比如:蓝天采集器教程;我们···