3个方案:
1.百度识图
打开
/product/ocr/general
这个页面中间有一个功能演示的可以识别PNG,JPG,BMP等文件格式
所以需要将PDF 转换成图片格式然后再来这里识别转换
提取PDF 扫描件的图片
下载 汉王PDF OCR单文件优化 V8.1.3免安装中文版
下载以后 打开
文件->打开图像->选择PDF,然后会自动识别成图片
识别—》选择全部文件->
然后 选择 输出->到指定格式文件—》选择HTML
记得把OUTPUT 文件路径改到自己知道的路径下哈
这个 3.files 就是图片
然后利用百度OCR 去识别图片就可以啦
/product/ocr/general
选择上传的图片,左边是原始图片,右边是识别出来的文字
将右边的文字复制,然后粘贴到txt文件中就可以啦。
方案二:
免费在线转换方案:
/ (非注册用户1M,10份,注册用户是20份)
/ (免费10M,10页)
这两个网站都支持在线识别PDF 图片文字
如果很紧急,采用付费模式,这2个网站是不错的选择,可以PDF 扫描转 TXT,Word……
不紧急,采用免费方式来转
如果PDF 太大,如何拆分了,还是在线方案(不想安装软件)
/zh_cn/fencai_pdf
选择要拆分的PDF文件,然后对文件进行页面级别拆分
点击PDF 分割,分割完以后,可以下载一个分割的PDF 包
然后将文件上传到上面2个OCR识别的网站去识别,然后下载下来对应的文件
上传完成以后转换会有1分钟左右的时间等待,没事儿就慢慢等吧,下载下来的可编辑的word如下图
大家会发现这个word也会有一些识别错误的,需要自己手动编辑啦,但是这个显然比之前的工作量要小很多啦。
3.直接付费转,不截图啦,太多啦