要爬的网站里分很多语言怎么选择只爬中文,
网站默认是英文的, 平时进网站先切换成中文再继续浏览
那在爬的时候之前我该怎么去做设置
可在 任务》采集器设置》请求头信息 中添加自定义 Accept-Languagezh_CN
通过添加 自定义 Accept-Languagezh_CN ,对我目标网站没有成功,可能他这个网站特殊,
但 我通过拿电脑登录他们网站, 然后去 取的 cookie,使用Cookie 缓存数据和Referer 来源网址, 再进去的话 就自动是中文了 ,谢谢
wangchenyuF2 发表于 2018-5-7 09:20
通过添加 自定义 Accept-Languagezh_CN ,对我目标网站没有成功,可能他这个网站特殊,
但 我 ...
自己动手丰衣足食!

- 1pbootcms常见标签调用学习
- 2餐饮及酒店行业网站建设方案
- 3蓝天采集器请教数据采集覆盖或修改之前入库信息的设置
- 4蓝天采集器图片本地化问题,请问一下站长
- 5蓝天采集器安装出问题 显示版本问题
- 6网站SEO优化100条解答经验分享31-55
- 7蓝天采集器怎么获取图片组?
- 8蓝天采集器建议:下个版本能否开发将“发布设置”导入导出?
- 9pbootcms分类栏目都调用一级栏目的banner图教程
- 10蓝天采集器正在校验更新文件
- 11蓝天采集器蓝天采集器2.2更新文档
- 12蓝天采集器为啥我的不能自动采集,有没有和我遇到同样问题的?
- 13蓝天采集器发布设置里绑定本地cms程序提示错误
- 14蓝天采集器JSON采集时,列表页即是内容页,采集卡死重采会重复采集
- 15蓝天采集器管理员可以加个功能不
- 16蓝天采集器WordPress子比主题Zibll 版本:5.7.1入库插件使用说明
- 17蓝天采集器求教繁体和简体,中文和英文的转换问题
- 18pbootcms升级到3.0.3+最新版文章点击后跳转首页解决办法
- 19盘企建站CMS火车头发布模块V1.1
- 20迅睿CMS火车头采集免登录入库接口和蓝天采集器入库使用教程
-
蓝天采集器请问关联页的内容怎么采集啊···
关联页的网址已经采集到了,但里面的内容怎么采集不到?还是和正常内容页的字段采集规则一样吗? 找到了,可以在数据源中选择关联页,刚发现这个下拉选择框.... 是的,要指定数据源
-
PbootCMS如何修改上传格式和支···
废话不多说,PbootCMS碰到需要修改文件上传格式的时候,首先去/config/config.php里修改upload配置信息,一般情况下,这里修改后就ok了。这边以一个图片格式为例来介绍,本文栗子上场→webp格式图片。什么是WebP格···
-
蓝天采集器WordPress BUG···
站点设置固定连接后 连接为空
-
蓝天采集器希望支持杰奇cms
希望支持杰奇cms 好的,会陆续支持
-
蓝天采集器JSON采集问题
本帖最后由 大拿 于 2018-6-27 13:21 编辑 采集目标页面打开如下: {"code":"0000000","message":"Rest Reque···