全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 520|回复: 4

@citywar 大佬还玩蓝天采集吗?

[复制链接]
发表于 2020-10-12 15:55:12 | 显示全部楼层 |阅读模式
遇到个问题,在discuz里面发布的时候<小于号后面的内容丢失

测试抓取的内容;
老王吃了3颗糖,血糖会<8.6的时候会低血糖

发布的内容;
老王池了3颗糖,血糖会

小于号<没有,后面的内容也没了。

你遇到过吗

@citywar
发表于 2020-10-12 20:53:01 | 显示全部楼层
本帖最后由 citywar 于 2020-10-12 20:59 编辑

他你采集的时候不是有替换功能吗  直接吧 符号替换成 文字  小于  

不就行了


〈div〉可能是因为这些html代码用的   好像也不能这样 那出现的问题太多了。

估计你只能在通用数据 处理里面  加个 工具箱 消除文本格式 html代码全消除  再替换文字(或者过滤所有html标签 只采文本  )


他里面一些符号是特殊符号 [XXX]这个符号因为是他的标识符  [内容1]
也不能用。我还傻傻做为截取,踩过坑
 楼主| 发表于 2020-10-12 23:18:58 来自手机 | 显示全部楼层
citywar 发表于 2020-10-12 20:53
他你采集的时候不是有替换功能吗  直接吧 符号替换成 文字  小于  

不就行了

刚看到。
发帖之前我都试过了,比如替换符号。但发现无论怎么改都不行。
为了验证是不是sky的bug,我又装了zblog试了一下发现可用,只有在discuz里面无法发布小于号后面的内容。经过反复的折腾和尝试打算放弃了。

晚上吃完饭还是不甘心,再试一次还是发布不了小于号之后的内容。

好像是discuz过滤& lt; 这个小于号的符号。但是zblog可以。

我还修改过discuz的ubb编辑器,仍然不行。

最后我想到了一个办法解决。先用sky采集目标站发布到zblog里。再用sky采集我的zblog的内容发布到discuz里就好了。
发表于 2020-10-13 03:46:46 来自手机 | 显示全部楼层
可以f12看看目标页面代码,采集器大都是按规则截取内容
发表于 2020-10-13 03:48:01 来自手机 | 显示全部楼层
哦不对,是发布哦,发布模块,内容转换
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-19 16:04 , Processed in 0.063139 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表