上一篇内容里面我们讲解了PbootCMS蓝天采集器安装的教程,如有不明白的可以好好看下,话不多说我们继续。
第一步:登录我们蓝天采集器:地址为:你的网址/(子目录或是栏目名称)/index.php?s=/Admin/Index/index
输入我们创建的用户名和密码登录进去。我们的后台是一个响应式的,匹配所有的终端,不用担心兼容性或者浏览不好的效果。
点击:设置---进入采集设置(站点设置和邮件设置这里后期可以自行去研究,一般是用不到的)
这里都没有什么需要注意的;多树就默认就好,选择好了就保存吧。
图片本地化设置:图片路径建议设置为我们网站默认的,地址也是一样,后期我们一旦不使用这个采集插件了可以直接删除掉不会影响我们的图片路径。设置完成记得选择保存。
页面渲染和代理、翻译这里讲一下:
页面渲染意思就是采集的时候的页面和我们打开浏览是一样的,我们的这个采集规则是利用的爬虫原理,去采集的时候是看不到样子的是从html里面去抓取的。这个渲染一般都是采集比较复杂或是困难的网站才需要用到,蓝天采集器里面默认是谷歌浏览器。
代理:这个是IP,有些复杂的网站我们频繁去采集是会封禁IP的,这时候我们就可以选择使用这个代理IP,现在这个版本是可以批量添加的非常方便。
翻译:默认是集成了有道,百度和腾讯翻译,这个可以随便选择,我们只需要去他们的官网注册一个开发着账号把APPID和密钥填写进来就好了,后期我们采集回来的内容就可以实现自动翻译并发布(这里就会用到我们的函数插件)。
以上的设置就没有了,接下来就是添加任务。
点击任务列表----添加任务:设置好以后点击保存。
以上呢就是我们PbootCMS蓝天采集器采集使用教程采集任务设置,接下来我们进入采集规则设置请点击这里:PbootCMS蓝天采集器采集使用教程二采集规则发布设置
相关知识点: PbootCMS蓝天采集器采集规则 PbootCMS蓝天采集器设置 蓝天采集器- 1蓝天采集器请问一下,获取正文的时候这种问题应该怎么解决
- 2蓝天采集器支持苹果cms吗
- 3163K网站系统商城物流跟踪-快递鸟配置教程
- 4蓝天采集器为什么我的采集间隔失效了
- 5蓝天采集器自动采集具体怎么用呢,需要服务器支持什么
- 6PbootCMS如何单独给某个栏目下的内容详情页设定seo标题规则
- 7蓝天采集器采集今日头条
- 8蓝天采集器内容页上一级是分页
- 9蓝天采集器CentOS 7 下搭建Tor代理服务器
- 10dedecms后台用吗密码忘记了-找回的简单操作方法
- 11蓝天采集器有没有可能增加这么一个“采集筛选”的功能?
- 12蓝天采集器求教内容页网址采集规则设置
- 13蓝天采集器采集网址总是提示“页面为空”是怎么回事?
- 14小碗熊cms5.0火车头采集器免登陆发布模块api
- 15Bty分销系统v5忘记密码找回的2个操作方法
- 16蓝天采集器请问发布方式的自定义插件是使用方法
- 17蓝天采集器关于列表页当作内容页采集的疑问
- 18蓝天采集器采集器取消了自动补全网址,还是会自动补全
- 19163K网站系统短信通知配置教程(S版)
- 20蓝天采集器列表页 分页如何设置
-
蓝天采集器数据库问题
入库数据库是Oracle数据库,,, 但是你这只能是MYSQL, 这样能配置成功吗 Oracle没测试过,要用的话也可以,浏览器中右键审查 数据库类型 select元素,把 <option value="mysql&q···
-
PbootCMS英文站搜索结果页面包···
在使用PbootCMS搭建英文站时会发现搜索结果页的面包屑为中文,标题为英文,该如何处理?可二开增加英文站对应文字来解决。修改内容打开ppshomecontrollerSearchController.php,把里面的代码全部替换成以下(···
-
pbootcms您访问路径含有非法字···
最近在做这个网站的时候遇到一个问题就是筛选菜单名称中带了、导致路径无法访问,由于我们的程序版本1.3+以后做了防注入所以路径中但凡是出现了特殊字符的时候都会给与拦截的(这里很感谢没皮的小芒果的帮助)您访问路径含有非法字符,防注入系统提醒您请···
-
网站SEO优化100条经验解答分享7···
76:企业站不需要太多收录 几十上百就不错了。如果上千就存在大量垃圾内容的危险。77:我刚才说了微调也是更新,你今天只画了个眉毛 没洗脸也算化妆了,不是蜘蛛喜欢什么而是用户,如果要更新就做些时效性强的 或者稀缺性的资源。78:已经包含在其他···
-
蓝天采集器后台更新系统失败
本帖最后由 达雅 于 2018-5-2 17:29 编辑 获取失败:/SkycaijiApp/Install/Data/install.sql复制代码提示这个问题,阿里云机子,宝塔面板 网速问题 刷新 再更新下 admin 发表于···