我这样去匹配 标题 在正则调试工具中是能匹配出来的 采集器环境中就不行了 只能<h1>[内容]</h1>这样匹配吗
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值
admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值
能直接支持正则就好了
admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值
请问运用 [内容]和捕获组这两个有什么区别么
juemeialg 发表于 2018-5-17 22:45
能直接支持正则就好了
支持正则的,只是说返回的匹配数据需要用个[内容]标签来装,可以过滤不要的html代码达到精准匹配,你肯定不想把<h1>也输出到标题里吧? 而捕获组也是正表达式的语法,百度下就知道了
wangchenyuF2 发表于 2018-5-18 01:21
请问运用 [内容]和捕获组这两个有什么区别么
[内容]是泛匹配,捕获组可以写正则精准匹配 相关知识点: 内容 正则 发表于
- 1蓝天采集器能不能在或者内容页的时候也能用XPATH
- 2蓝天采集器在测试爬取字段的时候,一直在转圈
- 3蓝天采集器怎么把采集得到的图片下载在本地?
- 4蓝天采集器采集的到内容但是发布时没采集到
- 5蓝天采集器循环入库的数据不到数据库
- 6蓝天采集器安装到最后一步出错了!怎么回事啊
- 7蓝天采集器JSON采集问题
- 8蓝天采集器关于设置和触发自动采集时系统会卡死状态!
- 9pbootcms文章如何新增自定义字段教程
- 10蓝天采集器无法检测到本地CMS
- 11蓝天采集器这个自增主键在哪设置呀。
- 12狂野小说cms白色优美-手机模版(wap)和蓝色简约版手机模板免费分享
- 13蓝天采集器希望能出官方教学视频教程
- 14蓝天采集器百度知道问题列表页测试抓取获取不到问题列表?
- 15PbootCMS后台登录验证码看不清怎么回事?
- 16蓝天采集器如何倒序采集
- 17蓝天采集器年后上线新版本,敬请期待!
- 18蓝天采集器z-blog发布问题
- 19pbootcms常见标签调用学习
- 20蓝天采集器采集网址总是提示“页面为空”是怎么回事?
-
163K系统S2版升级S3前注意事项···
1、登录网站后台,备份所有广告位(图片,链接等),保存到本地。2、自动升级开始前,备份数据库默认是勾选的,请不要取消勾选。3、自动升级前,稳妥起见,建议您先在网站后台手动备份下数据库,若备份成功,登录服务器,在网站根目录的bak下确保.ba···
-
蓝天采集器Z-BlogPHP 1.5···
没搞定,配置好后抓瞎了,不会操作,有搞定的能否分享个,谢谢了
-
163K网站系统微信支付、支付宝支付···
《微信支付、支付宝支付》实时原路退款配置教程 实时原路退款:当网站管理员确认退款后,用户的支付款项将实时退回到他原先的支付账户,大大提高站长的工作效率! 《163K网站系统》最新版目前已经全面实现《微信支付、支付宝支付》实时原路退款···
-
蓝天采集器咨询开发Unicode编码···
数据处理(通用)-工具箱 相对应的代码文件是哪个呢?由于采集JSON数据,里面中文被Unicode编码了 现在想在工具箱位置 添加个Unicode编码解码功能.请教下开发具体对应文件代码是哪个?技术员能加上这个功能就更完美了 技术放假还···
-
蓝天采集器希望指定网址允许重复采集或···
有的网址,一直都是一样的,只是里面的数据会变,比如pubg的新浪微博,这是微博的json数据 https://m.weibo.cn/profile/info?uid=6037906900 这网址一直不会变,但里面的数据就会变,如果可以单独指···