采集器设置:规则名称就是你要采集内容对应的名称,比如你要采集新闻这里就可以写新闻,你自己去规划,都填写完成记得保存。
起始页网址:这里呢我们可以设置栏目页也可以设置列表页。
内容页网址获取-选择正则(这种比较方便简单)操作完成记得保存,测试一下。
点击保存就好了,每一步都可以测试一下。
这里的规则其实还有可以使用xpath;
xpath的采集规则呢相对正则来说是更加的快捷,//*@class="news_info"/a1/@href;
*是匹配所有的意思;
@是标签;
class="news_info这个是我们网页唯一的代码标识;
/代表是一层路径,//代表的是两层路径;
a1这里这个1是指的只显示1条,因为很多时候页面上一个名称有好几个链接我们就需要在这里设置只显示一条就好了。
获取内容:
最简单方式就是直接打开这个页面用快捷键;
蓝天采集器标题设置
蓝天采集器标题设置;内容里面我们可以选择数据处理过滤一些标签、空格等:
略缩图设置;由于我们的发布插件里面没有设置,需要我们手动去设置一下:文件路径在:蓝天采集器安装目录plugin eleasecmsPbootDemoSkycaiji.php
这里是对应了我们的数据库信息;我们也可以多添加一些,只需要和我们的数据库对应起来就好了。
以上这个插件修改只是增加略缩图,要是不需要的话不用作任何的修改;点击保存就可以了。
接下来就是点击发布设置:先在第三方云平台下载pbootcms文章插件(没皮的小芒果开发);
发布方式选择本地CMS就可以了,数据库这些发布方式适合单独存放用不建议新手选择使用。
本地数据绑定这里的路径一定要注意:D:phpstudyPHPTutorialWWW@pboot 结尾带上pboot,还有就是路径不要绑定在采集器里面。然后选择我们的CMS插件就可以了,这里就直接选择我们刚才设定内容数据 点击保存,接下来直接保存就好了。
设置完成点击回到我们的任务列表,点击采集就可以了。
以上如还有不明白的地方都可以直接进群咨询交流:548327025。
如看了以上的还不明白可以直接看下我们的视频教程:
相关知识点: PbootCMS蓝天采集器 PbootCMS蓝天采集器发布规则 蓝天采集器- 1影视站建设教程-零基础搭建影视站
- 2蓝天采集器开启自动采集设置PHP-CLI(命令行)教程
- 3极致cms火车头采集内容带评论入库操作教程
- 4PbootCMS模板安装与授权方法
- 5蓝天采集器图片本地化问题,请问一下站长
- 6蓝天采集器无法抓取内容页网址为相对地址的列表
- 7蓝天采集器采集腾讯企鹅号自媒体内容教程(附采集规则)
- 8蓝天采集器提示信息
- 9蓝天采集器自动采集不定时停止运行
- 10蓝天采集器年后上线新版本,敬请期待!
- 11蓝天采集器发布文章时候提示 未获取到“作者账号”:
- 12zblog蓝天采集器发布插件带评论置顶标签
- 13蓝天采集器不算BUG的BUG(发布方式为数据库插入成功却提示失败)
- 14蓝天采集器有没有附件同步到OSS服务器这么一说?
- 15蓝天采集器使用中发现几个问题
- 16蓝天采集器是否可以利用火车头的免登录发布程序发布数据呢?
- 17蓝天采集器这个自增主键在哪设置呀。
- 18蓝天采集器反馈个BUG
- 19蓝天采集器数据处理内容替换 支持正则吗
- 20蓝天采集器dedecms发布问题
-
zblog蓝天采集器发布插件带评论置···
zblog是一款轻量化的博客程序,简单小巧,数据库就几个字段,占用体积也是非常小。蜀戎给大家分享下蓝天发布插件参数配置;我们的发布插件默认的只要标题、内容、作者、分类、还有一个自动摘要功能,其他都没有了。蜀戎根据需要来添加了更多的功能,看下···
-
蓝天采集器如何卸载删除操作教程
蓝天采集器当我们不在使用了以后如何卸载删除呢,相信许多的站长都有遇到这个问题。今天蜀戎网就给大家讲解一下蓝天采集器在不使用以后如何卸载删除。因为蓝天采集器属于插件类型的一个小源码直接安装的,会直接用到数据库存放信息的,所以我们卸载的时候也要···
-
手把手教你做PbootCMS自动替换···
本篇主要是为这篇文章(未备案域名怎么使用国内cdn加速网站?)进行pbootcms相关补充,主要为了解决网站放在香港小水管主机图片加载太慢问题,或者放国内主机带宽小且网站图片多。此二开实现图片走七牛云等提供镜像存储的cdn服务商,这样可以明···
-
蓝天采集器怎么发布规则到云平台
发布规则和大家交流一下 自己又找到了。。。。
-
蓝天采集器请求MAC如何设置渲染采集···
开启了渲染采集,也配置了chrome路径,甚至安装了chromedriver都不行,是不支持mac还是需要其它设置? 采集设置》页面渲染设置 配置成功后会显示“渲染工具正在运行” mac没试过,你在命令行输入代码试试是否有效chrome ···