每天都会有新的视频上传, 但新的页面上的 数据会顶掉前一天的数据,就是 前一天在第一页的数据 跑到第二页了, 也有可以 只过去了一部分 还有一半留在第一页,这个该怎么办呢
这个没办法的,所有网站的列表页数据都是显示最新的(除非网站自己有排序选项),这样不挺好的吗,可以实时同步更新
那按照这样来讲的话,第一天抓取第一页
如:
wwvv. bai du .c o m/1
得到 :20 个条数据
, 第二天想得到新的数据的话
从 已采集数据列表删除 wwvv. bai du .c o m/1 的记录
然后再重新抓取wwvv. bai du .c o m/1 么?
如果是这样的话 : 如果 他的第一页 没有更新, 那我抓到的不就是重复的了么,还是说,他会自动去更新
wangchenyuF2 发表于 2018-5-9 01:27
那按照这样来讲的话,第一天抓取第一页
如:
wwvv. bai du .c o m/1
你这是27盘吧,他不是直接有api,还用你自己采集啥
wangchenyuF2 发表于 2018-5-9 01:27
那按照这样来讲的话,第一天抓取第一页
如:
wwvv. bai du .c o m/1
系统会根据网址自动排重 相关知识点: 的话 第一页 数据
- 1蓝天采集器采集的到内容但是发布时没采集到
- 2蓝天采集器如何关联多页采集规则教程
- 3蓝天采集器正在校验更新文件
- 4html5外贸营销型网站建设方案
- 5营销门户网站建设方案
- 6蓝天采集器关键json采集的问题
- 7蓝天采集器拼接网址问题--卡壳了
- 8蓝天采集器请问有时候自动采集会停止时我配置参数不对吗
- 9蓝天采集器如何将采集到的文章发布到米拓的新闻资讯里
- 10pbootcms分类栏目都调用一级栏目的banner图教程
- 11Bty分销系统v5忘记密码找回的2个操作方法
- 12蓝天采集器API接口使用问题
- 13蓝天采集器采集重复: 被采集的内容页网址会自动变导致重复
- 14蓝天采集器为啥我的不能自动采集,有没有和我遇到同样问题的?
- 15蓝天采集器请问发布方式的自定义插件是使用方法
- 16163K网站系统二维码跳转进入小程序--待完善
- 17蓝天采集器蓝天采集好像不支持伪原创哦
- 18蓝天采集器求助-内容页网址获取- 测试时和实际采集时结果不同
- 19linux系统centos7安装chrome的操作教程
- 20蓝天采集器2.0版本不能自动采集的问题
-
pbootcms类型站点怎么查看图片···
1、先在图片或相应的元素上 点击 右键-属性 可以看到路径、大小、颜色,图片同名同格式用ftp覆盖。查看元素的颜色,然后修改相应的CSS。2、如果上个方法看不到,在图片或相应的元素上 点击 ···
-
proc_open函数如何开启操作教···
(PHP 4 >= 4.3.0, PHP 5, PHP 7)proc_open — 执行一个命令,并且打开用来输入/输出的文件指针。蓝天采集器在开启渲染模式的时候会要求先开启proc_open函数,proc_open函数可以操作执行服···
-
蓝天采集器发布设置,点击保存后,没有···
发布设置,点击保存后,没有任何变化 ,类似刷新一下后,还是没有变化 之后又试了下, 用nginx的 可以正常保存 Apache的不可以 apache-2.4 mysql-generic-5.5 php-7.1 LA···
-
蓝天采集器能做成帖对贴更新的功能吗?
能做成帖对贴更新的功能吗? 就是跟小偷程序一样 比如 目标站A帖子更新 自动采集到自己站帖子A 完全根据目标站的内容更新而更新帖子!
-
蓝天采集器exception 'Re···
比如访问:https://www.liuzhishi.com/page/2/ exception 'Requests_Exception' with message 'cURL error 60: SSL certificate probl···