本帖最后由 ihua 于 2019-6-20 12:00 编辑
我写了一个电影资源采集的东西
所有东西都很正常,但是下载链接(本应是磁力)变成了如下样子:
http://www.abc.com/def/magnet:?xt=urn:btih:b7d7eda2ef502a1d9fcd13f2be1fdc7a0e541c0a&dn=Human.2015.720p.BluRay.x264-WiKi&tr=http%3A%2F%2Ftracker.trackerfix.com%3A80%2Fannounce&tr=udp%3A%2F%2F9.rarbg.me%3A2710&tr=udp%3A%2F%2F9.rarbg.to%3A2710
应该将http://www.abc.com/def/这部分去除。
尝试字段采集后进行“数据处理”,但无法成功。
后来,想再采集CMS插件脚本中实时将“http://www.abc.com/def/”替换成“”也没能成功(因为个人不熟悉php操作mysql)不知道可行不可行?
希望有办法解决的大佬们给点建议。
已经解决:
问题出现:当采集数据才关联页时,网址会强制补全,如果内容页时起始页就没问题。
修复方法:
如题,解决方案如下:
在SkycaijiApp/Admin/event/Capttern.php1316行,即
- $val_values=implode($this->config['new_paging_fields'][$fieldName]['delimiter'], $val_values);
下面一行。
加入内容:
- $val_values= str_replace("http://www.abc.com/cef/","",$val_values);
如需替换其他,再加一条替换网址就行! 这是个笨方法 相关知识点: 东西 代码 网址
- 1蓝天采集器关键词过滤
- 2PbootCMS如何限制后台图片上传大小
- 3各大平台站长推送平台简介
- 4蓝天采集器关于判断
- 5SEO学习向导流程适合SEO零基础入门站长
- 6163K网站系统升S版前注意事项和准备工作
- 7PbootCMS获取结果页面的搜索keyword值和tag值
- 8PbootCMS升级时文件IndexController.php更新失败,请重试!解决办法
- 9蓝天采集器关于标题获取,部分标题带“-”获取不完整的解决办法
- 10Typecho1.1轻博客在线安装操作教程
- 11蓝天采集器给作者一个网站
- 12蓝天采集器为什么无法安装
- 13蓝天采集器站长采集规则不能直接写正则表达式吗
- 14蓝天采集器建议
- 15蓝天采集器dede5.7发布不发标题
- 16蓝天采集器z-blog发布问题
- 17火车头采集器FTP连接出现530 Login authentication failedvoid 错误解决办法
- 18蓝天采集器群主希望能支持destoon7.0
- 19蓝天采集器采集器时间问题
- 20蓝天采集器论坛招版主,截止12月底
-
蓝天采集器起始网址无法通过POST方···
起始网址无法通过POST方式批量获取列表页 列表页暂时只能手动指定get类型网址 字段》时间》转换成时间戳 勾选即可
-
蓝天采集器发布到mysql出错
在后台已经清除了缓存 再试的结果还是如下,数据库测试成功 但保存成功后,再测试又提示数据连不上了,再试测试采集 还是连不上了 数据库编码 utf8和 utf-8都试了 结果还是一样。 是不是php7?蓝天采集···
-
蓝天采集器采集腾讯企鹅号自媒体内容教···
腾讯企鹅号自媒体内容每天的阅读量是非常高的,它可以实时的吧我们发布的内容推送到腾讯自家的客户端上面;比如:天天快报、腾讯新闻客户端、微信新闻插件、手机QQ新闻插件、手机腾讯网、QQ浏览器等网络媒体中传播,曝光转化率不会逊色于微博头条等。今天···
-
蓝天采集器希望能出官方教学视频教程
新人,很多不太懂,单看手册还是写的太简单,希望能出些视频教程,实际演练视频
-
163K网站系统升级S版后注意事项(···
升级到S5版本后,由于后台是全新改版,请您完全清理浏览器缓存再用admin账号登录管理,可避免点击后台菜单出现访问前台首页的情况,同时在后台-系统-后台用户 需重新设置一次其他管理员账号的权限。X版成功升级到S版后,您需要做以下设置再访问网···