全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1863|回复: 21

{解决啦}100多万字准备纯手工打字,把17本书写进网站

[复制链接]
发表于 2019-3-14 14:52:57 | 显示全部楼层 |阅读模式
本帖最后由 ynuigv 于 2019-3-14 15:50 编辑

有17本书,打算写进网站,方便碎片时间能随时随地的阅读一下
昨天花了10个小时把它们从微信读书里,全部滚动长截图保存出来了,图片总共近90M
其实把这些图片传到sm.ms 然后放到网站上也一样能看,但是想对一些句子一些段落做做笔记,做做注释,这样就要纯文字了
今早又花了几个小时找ocr软件,希望能直接从图片里复制文字出来。首先是abbyy,不知道为什么,明明下载试用版的,但是安装后愣是没有试用选项,折腾很久只好放弃
然后又找了国产ocr软件,一句话: 全部垃ji !!几乎都不能用...这里奉劝mjj们,以后如果遇到ocr需求,千万别把钱用在买这类国产软件上,浪费钱和浪费时间
最后用了微软的onenote,至少是秒杀一切国产ocr软件,还免费.用完发现效果还是不满意,错误率有点高.(这里说明一下:因为我是截图电子书,一张图的文字都是成千上万的,所以错误率会高一些.但如果我提取的是目录图片的文字,因为才一两百个字,所以正确率能到95%,对于机器取字来说,已经没什么可抱怨的)
最后,干脆决定纯手工打字,这样能一边打一边加深印象,还能及时排版.粗略算了下:17本书至少是上百万个字
感觉这项工程有点艰巨啊
发表于 2019-3-14 15:25:21 | 显示全部楼层
楼主,我有一款不错的OCR文字识别软件,推荐,只有2M
项目地址:https://github.com/AnyListen/tianruoocr_last


软件下载地址:
百度网盘:https://pan.baidu.com/s/17T1MR6R7EQ4zvgeokTMFeA
Github:https://github.com/AnyListen/tianruoocr_last/releases

软件截图



希望能帮到你!hostloc 助人为乐 互助互利
发表于 2019-3-14 14:54:28 来自手机 | 显示全部楼层
工程量巨大
发表于 2019-3-14 14:55:27 | 显示全部楼层
感觉很耗时哦
发表于 2019-3-14 14:55:54 | 显示全部楼层
abbyy有破解版的,找找吧,比你打字省心不少啊
发表于 2019-3-14 14:57:20 | 显示全部楼层
现在人工智能这么牛逼,不是都能识别了么?
发表于 2019-3-14 14:57:52 | 显示全部楼层
老板,招打字员吗?
发表于 2019-3-14 14:58:22 | 显示全部楼层
楼主招打字员吗?
发表于 2019-3-14 14:58:32 | 显示全部楼层
不是有扫描笔和ocr识别软件吗?你这么干效率很低吧
发表于 2019-3-14 15:00:33 | 显示全部楼层
真猛哈哈哈
 楼主| 发表于 2019-3-14 15:00:35 | 显示全部楼层
ApkB 发表于 2019-3-14 14:55
abbyy有破解版的,找找吧,比你打字省心不少啊

能力有限,谷歌了很久也没有找到能用的破解版
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-27 06:28 , Processed in 0.070997 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表