我们在采集内容的时候,比如有些网站img图片内容非常多或者是对方站点添加了密密麻麻的水印,这个时候我们就需要过滤掉,该如何来设置屏蔽掉呢,请看下面的教程。
登录蓝天采集器后台:任务----任务列表----选择对应任务
点击---获取内容字段----选择需要过滤的字段名---选择数据处理
选择:html标签过滤 (如下图设置)
选择需要过滤的img的参数内容,点击保存,这样我们采集回来的内容就会自动吧img的内容过滤掉,比如我们还可以手动添加,png.jpeg等。以上就是全部的操作教程,入还有不明白的地方欢迎下方留言。
相关知识点: img过滤- 1蓝天采集器请教58同城采集规则设置
- 2蓝天采集器无法安装怎么回事???
- 3PbootCMS蓝天采集器采集使用教程一采集设置
- 4蓝天采集器自动采集具体怎么用呢,需要服务器支持什么
- 5迅睿CMS火车头采集免登录入库接口和蓝天采集器入库使用教程
- 6蓝天采集器伪静态后台有问题
- 7蓝天采集器数据库发布时遇到组合的怎么办
- 8163K网站系统S3新版首页内容设置说明
- 9蓝天采集器内容页上一级是分页
- 10易优cms(eyoucms)蓝天采集器发布插件
- 11蓝天采集器这个自增主键在哪设置呀。
- 12pbootcms常见的导航高亮下拉标签设置教程
- 13蓝天采集器分类信息采集,列表数据循环入库示例教程
- 14蓝天采集器请问一下,能采集JS渲染的内容吗?
- 15宝塔控制面板php.ini文件在那个文件目录里面
- 16163K网站系统《163K网站系统》在线升级配置和使用说明
- 17七牛云加速域名开启https教程
- 18蓝天采集器蓝天采集器1.2版本正式发布
- 19PbootCMS蓝天采集器采集使用教程二采集规则发布设置
- 20蓝天采集器如何倒序采集
-
蓝天采集器求助-内容页网址获取- 测···
我想要采集的内容页是首页-列表页-内容页-实际内容页 当采集到内容页后测试时可以显示出实际内容页 但实际采集中就显示不出实际内容页 实际内容页的链接是/******这种形式的,补全网址了也是采集不到 这种情况要怎么处理呢 你测试···
-
163K网站系统升级S版后注意事项(···
升级到S5版本后,由于后台是全新改版,请您完全清理浏览器缓存再用admin账号登录管理,可避免点击后台菜单出现访问前台首页的情况,同时在后台-系统-后台用户 需重新设置一次其他管理员账号的权限。X版成功升级到S版后,您需要做以下设置再访问网···
-
163K网站系统S3新版首页内容设置···
-
阿里云SSL证书在宝塔控制面板配置教···
最近蜀戎网接到几个咨询如何把阿里云申请的ssL证书部署到宝塔的控制面板上面,今天就给大家分享一下操作教程。首先登录阿里云控制后台----SSL证书管理----已签发证书----找到对应证书点击下载。点击已签发证书在这里选择我们对应的版本就可···
-
Fatal error: Allow···
今天在做一个小浣熊漫画CMS数据采集时候遇到的一个问题,把解决方法给大家分享一下。网站运行也都有一段时间了,今天调整了一下采集规则,导致网站访问首页就出现错误代码;Fatal error: Allowed me···