http://不能发.com/v.php?next=watch&page={param:num,1081 2161 1 0}然后爬到的永远是某一页,
http://不能发.com/v.php?next=watch&page=10000
(这个是他们没有的网页,他们只有1-4335页) 大写的10000 是分页
还是能爬到内容, 我到测试页面测试 把分页改成任何数字 爬到全是相同的, (没挂IP,没挂 自定义头)(挂了也一样)
不知道问题出在哪
爬到相同的页面是有数据的还是对方的提示页面?有可能是对方有ip访问频率限制
admin 发表于 2018-5-15 21:59
爬到相同的页面是有数据的还是对方的提示页面?有可能是对方有ip访问频率限制 ...
是有数据的,但数据都一样,好比如:我让他爬 6 7 8 页.他爬的三个页面都是是 第7 页的数据 , 我让他 爬 1 2 3 页, 得到的 还是第7页的数据, 给我感觉就是 我的IP被绑在他的第7页了 浏览器打开网址正不正常?抓取其他网站内容正不正常,如果都正常,估计就是ip被屏蔽了 相关知识点: 爬到 页面 数据
- 1蓝天采集器论坛招版主,截止12月底
- 2蓝天采集器Z-BlogPHP 1.5.1 Zero发布插件有谁成功的
- 3小浣熊漫画cms首页热门点击数人气是0的处理方法
- 4蓝天采集器要爬的网站里分很多语言怎么选择
- 5163K网站系统商城物流跟踪-快递鸟配置教程
- 6自带采集PHP小说网站源码:功能强大KYXSCMS狂雨小说cms网站源码
- 7蓝天采集器AMH里面,安装到第三步点下一步,不会进行下去了
- 8蓝天采集器管理员账号密码限制有些短
- 9PbootCMS内容轮播多图增加标题和描述
- 10蓝天采集器后台更新系统失败
- 11蓝天采集器发布问题
- 12蓝天采集器这个网页怎么采集
- 13蓝天采集器WORDPRESS采集数据后不入库
- 14蓝天采集器内容页只能采集一页?
- 15蓝天采集器开启循环入库后,将以第一个循环字段的数量为准
- 16PbootCMS安装蓝天采集器教程
- 17蓝天采集器年后上线新版本,敬请期待!
- 18pbootcms网站Tags标签伪静态处理教程
- 19蓝天采集器图片本地化的功能,目前貌似没用?
- 20蓝天采集器发布方式不能选择post方式发布嘛?
-
蓝天采集器三级网页采集方式?
主页 列表 内容 类似小说网站。。。 怎么设置呢 没搞懂 只采集到列表页所有的 是不是多级设置?先从默认页面进去 然后通过多级设置,多级设置的最后一个开始采集内容??? 起始页》主页 多级网址规则》小说列表页 内容网址规则》小说内容页
-
PbootCMS中文域名获取授权码注···
通过PbootCMS搭建的网站域名都需要免费获取授权码才可以打开,如果域名中含有中文,那就会提示“域名格式有误”,这是为什么呢?如下图:解决方法:1、先给中文域名转码,中文域名转码地址:中文域名转码 - 站长工具 - 知道创宇云防御 (yu···
-
163K网站系统S3新版首页内容设置···
-
pbootcms在打开首页的时候No···
当上面吧网站清空根目录以后呢,上传新的数据,接着访问我们的网站。在一些时候打开首页的时候就会出现一些错误,比如今天蜀戎网要分享的就是:No input file specified.的解决办法。最常见的就是虚拟主机出现这种情况,.user.···
-
163K网站系统图片系统+七牛云存储···
图片七牛云存储说明:1、开启七牛云存储后,全站的图片数据的调用和流量都将基于您的七牛云空间,可极大程度释放您网站服务器带宽的压力,大幅提升网站的显示速度2、图片数据默认自动上传到您网站本身的服务器上,当图片被初次浏览的时候即自动同步到您的七···