最近做了狂野小说的蓝天采集器发布插件,今天给大家带来的教程是系统自带的集成采集器规则的使用教程。
狂雨小说CMS是一个非常不错的小说程序,(以下简称KYXSCMS)提供一个轻量级小说网站解决方案,基于ThinkPHP5.1+MySQL的技术开发。
KYXSCMS,灵活,方便,人性化设计简单易用是最大的特色,是快速架设小说类网站首选,只需5分钟即可建立一个海量小说的行业网站,批量采集目标网站数据或使用数据联盟,即可自动采集获取大量数据。内置标签模版,即使不懂代码的前端开发者也可以快速建立一个漂亮的小说网站。
今天我们就来介绍以下采集规则教程;登录后台点击-----数据采集。
列表网址:
获取区间:<div id="newscontent">内容<div class="pages1">
如上图所示:我们的列表页获取区域选择的时候最好是选用具有唯一性的标签,这样抓取的时候不容易出现空白。
网址规则:
<span class="s2"><a href="内容1">
章节页:
从页中提取:默认内容页
是否章节列表:是
获取区间:<div id="list">内容<div id="footer" name="footer">
wangz
网址规则:<dd><a href="内容1" title="(*)">章节标题</a></dd>
内容规则:
栏目规则:<meta property="og:novel:category" content="内容1"/>
名称规则:<meta property="og:novel:book_name" content="内容1"/>
作者规则:<meta property="og:novel:author" content="内容1"/>
连载规则:<meta property="og:novel:status" content="内容1"/>
图片规则:<meta property="og:image" content="内容1"/>
介绍规则:<div id="intro">(*)<p>内容1</p>
标签规则:<meta property="og:novel:category" content="内容1"/>
章节名称规则:<h1>内容1</h1>
章节内容规则:<div id="content">内容1</div>
由于规则内容过多,我们就不一一截图了,采集整站的规则都在这里了,可以直接复制粘贴,然后点击保存就可以实现整站的采集小说了。程序默认是自动进行采集的,只要有人访问就会触发系统进行采集非常的方便。另外针对这个狂雨小说cms我们蜀戎网络也开发了配套蓝天采集器采集发布使用的发布插件,也是一样可以实现自动采集入库的,欢迎前来咨询。针对那种加了仿采集的页面使用我们的蓝天采集器就可以很好的模拟蜘蛛进行抓取,非常的便捷。
- 1蓝天采集器jsnop如何采集?
- 2蓝天采集器在服务器上部署,最后一步数据发布没反应??
- 3网页HTTP状态代码404/503/200的说明
- 4蓝天采集器采集的到内容但是发布时没采集到
- 5医疗/医院网站建设方案
- 6163K网站系统网站客服的QQ在线状态设置说明
- 7什么是JSON采集?
- 8蓝天采集器https的网站不支持加载云平台
- 9蓝天采集器希望能优化的地方
- 10蓝天采集器伪静态后台有问题
- 11蓝天采集器蓝天采集器安装时候出现的问题
- 12蓝天采集器发布设置,点击保存后,没有任何变化
- 13蓝天采集器请大佬帮忙看一下 要采集这个站的快讯要怎么设置
- 14蓝天采集器怎么才能循环采集某个页面的相同值
- 15如何获取当前页面cookie填写在蓝天采集器里面
- 16蓝天采集器出现无法加载数据库驱动什么情况!求解决!!!!
- 17163K网站系统升S版前注意事项和准备工作
- 18狂雨小说CMS网站fileinfo插件安装方法
- 19163K网站系统升级S版后注意事项(含S5)
- 20蓝天采集器只能翻译一个字段。
-
蓝天采集器求助 发布设置中WordP···
怎么进行数据绑定呢?目录路径应该怎么填?网站是放在根目录下的 你的采集器也是在根目录(或子目录)里吗? 可以直接输入你的网站目录,win主机就输 磁盘:/路径,linux就输/目录 admin 发表于 2018-3-16 21:43 你···
-
Typecho1.1轻博客在线安装操···
Typecho轻博客程序,使用的人群也是非常的多,今天在写蓝天采集器的时候有网友推荐过来,索性就安装了一个并且写了一套免登陆的API,蜀戎网呢把安装教程给大家演示一下,希望能帮助到您。主机环境必须达到:PHP 5.1以上Mysql, Pos···
-
蓝天采集器WordPress子比主题···
author是作者账号作者(必选)category是分类分类(必选)title是文章标题标题(必选)content是文章内容内容(必选)seo_title是独立SEO标题选择采集字段(select)seo_keyword是独立SEO关键字选···
-
蓝天采集器求Xiuno BBS发布接···
cms程序名:Xiuno BBS官方网址:https://bbs.xiuno.com/ 最好是能把附件也POST,因为这个系统的附件信息是有专门数据表存放的 求大神出招 不好意思,对这个程序还没研究,可以发布需求 http://www···
-
手把手教你做PbootCMS自动替换···
本篇主要是为这篇文章(未备案域名怎么使用国内cdn加速网站?)进行pbootcms相关补充,主要为了解决网站放在香港小水管主机图片加载太慢问题,或者放国内主机带宽小且网站图片多。此二开实现图片走七牛云等提供镜像存储的cdn服务商,这样可以明···