本帖最后由 wx_G50oLulx 于 2018-4-15 23:32 编辑
我遇到个采集的问题。json数据
比如我这个json是这样的
data下面有0-20 ,0-20下面comments在里面的0-20才是我要的数据,这个该怎么提取,我试着用正则表达式不行。求解
用json提取 object.data.data ,但是0-20是个循环,暂时不行,下个版本支持 json 通配符
admin 发表于 2018-4-15 23:39
用json提取 object.data.data ,但是0-20是个循环,暂时不行,下个版本支持 json 通配符
...
非常感谢大佬回复,下个版本有时间进度吗?
admin 发表于 2018-4-15 23:39
用json提取 object.data.data ,但是0-20是个循环,暂时不行,下个版本支持 json 通配符
...
另外还有个小问题,为啥首页会404 ,但是我访问其他页面都正常。。。。 正在开发中,上线时间不确定,php7首页访问不了,下个版本支持php7
admin 发表于 2018-4-15 23:48
正在开发中,上线时间不确定,php7首页访问不了,下个版本支持php7
我发现了 我点首页是http://www.xxx.com/.php?m=admin&c=base&a=index
确认的应该是http://www.xxx.com/index.php?m=admin&c=base&a=index
少了个index 相关知识点: 下个 版本 是个
- 1火车头采集器伪原创php插件
- 2蓝天采集器数据库发布时遇到组合的怎么办
- 3163K网站系统腾讯云验证码配置说明
- 4蓝天采集器感谢一下skycaiji。便利各路苦逼站长SEO
- 5蓝天采集器请教一下,如何采集js里的数据?
- 6蓝天采集器关于列表页当作内容页采集的疑问
- 7pbootcms在打开首页的时候No input file specified.解决办法
- 8{pboot@sql sql="语句"}[sql:字段]{/pboot@sql}万能循环标签使用介绍
- 9蓝天采集器采集网址问题
- 10易优cms(eyoucms)蓝天采集器发布插件
- 11蓝天采集器安装采集器不能进入数据库安装的哪一步
- 12蓝天采集器采集两个就停下不动了
- 13蓝天采集器给作者一个网站
- 14蓝天采集器数据库 发布失败 发布以一条后停止
- 15蓝天采集器dedecms标签怎么写?
- 16pbootcms升级到3.0.3+最新版文章点击后跳转首页解决办法
- 17pbootcms详情页判断有无轮播图调用缩略图或者内容第一张图教程
- 18狂雨小说cms伪静态设置
- 19蓝天采集器请大佬帮忙看一下 要采集这个站的快讯要怎么设置
- 20蓝天采集器采集到的磁力链接前面有固定网址怎么去除?!
-
蓝天采集器请问一下 多级网址获取 应···
http://www.59xihuan.cn/meiwen/ 比如我要采集这个栏目的所有链接,我应该怎么使用多级网址获取 这种的分页格式应该怎么去采集 网址, 和上面的文章链接 你这个直接起始网址批量生成就可以吧? 非要多级,匹配分页网址···
-
蓝天采集器怎样判断获取的图片地址是否···
如题,如果404,则不采集。 解决了,在写入数据库之前加上一个 404判断就行。。如果非404 再写入,如果404返回错误。 你的也是个办法,一般情况下404或者抓取不到图片都会自动跳过抓取 admin 发表于 2018-11-22 ···
-
蓝天采集器内容允许匹配多个元素循环入···
我们平时在采集一些论坛或者贴吧,问答平台等都会有多段内容,在写采集规则的时候我们就要换一种操作方法,利用我们的循环入库。我们就以http://bbs.skycaiji.com/forum.php?mod=viewthread&tid···
-
蓝天采集器您好,我的采集到这卡住了,···
测试的时候还是可以得到数据的 设置》采集设置 ,设置下每次采集数量,页面抓取间隔设0,这个bug下个版本修复
-
蓝天采集器通过 Tor 代理 如何绕···
目前基于 CentOS 7 x64 搭建 了 tor + socks5 转 http代理的一个服务器, tor每分钟更换一次IP, 能抓的到,baidu.com的 源码, 但测试 www.skycaiji.com抓不到源码,请问需要怎么配置···