目录
工作中经常会碰到这样的情况:一份纸质文件扫描成了图片格式的PDF,里面的文字没法复制;网上一张截图里的内容挺有用,但只能一个字一个字重新打;某个软件界面或者视频里的字幕想保存下来,又不知道怎么操作。这些场景都离不开OCR文字识别技术。
OCR的全称是光学字符识别,简单说就是让电脑“看懂”图片里的文字,然后把它们转换成可以复制、编辑的文本。市面上OCR工具有很多,从免费的到收费的,从需要联网的到离线的,各有各的长处。
如果你只是偶尔识别几个字,QQ截图自带的识别功能就够用了,不用装任何额外软件。如果是批量处理,或者文件内容比较敏感不适合上传到网络,就可以选择离线的专业OCR工具。
下面分别介绍几款主流的文字识别工具,你可以根据自己的实际需求来选择。
官网入口地址
易飞文字识别网页版:访问易飞官网或直接在微信小程序搜索“易飞文字识别”
VeryCapture官网:https://verycapture.com
识字精灵:暂无官网,需从吾爱破解论坛等渠道获取下载链接
下载地址
VeryCapture下载:官网首页即可下载Windows版本安装包
识字精灵下载:吾爱破解论坛搜索“识字精灵”获取蓝奏云下载链接
QQ截图文字识别功能介绍
很多人天天用QQ聊天,但不知道QQ截图里藏着一个很实用的文字识别功能。这个功能操作特别简单,不需要安装任何插件,只要是装了QQ的电脑都能用。
使用方法很简单:登录QQ后,按快捷键Ctrl加Alt再加O,或者点击聊天窗口里的剪刀图标选择“屏幕识图”,然后用鼠标框选你要识别的区域,松开鼠标后QQ就会自动识别这片区域里的文字,直接把识别结果显示出来。
识别出来的文字可以直接复制粘贴,还可以一键转成腾讯在线文档,省去了先粘贴到记事本再保存的麻烦。另外QQ截图还支持翻译功能,选中识别结果后可以直接翻译成他语言。
除了文字识别,QQ截图本身也是个很强大的截图工具。它支持标注、画箭头、画形状、添加文字、打马赛克,还能把截图钉在桌面上当参考。最近更新后还增加了自动打码和一键加水印的功能,做个简单的图片处理够用。
QQ截图文字识别应用场景
上班族场景:开会的时候PPT上有一段重要的数据,用QQ截图框一下,文字就出来了,直接复制到会议纪要里,不用一个个打字。
学生场景:老师在网课里放了一页知识点截图,用QQ截图识别成文字,整理到笔记里方便复习。
日常办公:收到同事发的图片格式文档,里面有几段需要引用的话,截个图识别一下就能复制出来了。
易飞文字识别功能介绍
易飞文字识别是一款支持多平台的OCR工具,既有网页版也有手机App和小程序版本。它的识别准确率比较高,普通印刷体的文字识别准确率能达到百分之九十八以上,手写体也能达到百分之九十左右。
网页版的使用门槛很低,打开网站后直接把图片拖进去,或者用Ctrl加V粘贴图片,系统就会自动开始识别。支持批量处理,一次可以拖进去多张图片或者PDF文件,识别结果支持复制、导出。
手机端的功能更丰富一些。用手机摄像头拍文档的时候,App会自动裁剪和矫正透视,让拍出来的文档看起来像扫描的一样规整。识别出来的文字可以保存为文本,也可以直接生成PDF。它还支持云端存储,识别过的文件会自动备份,换手机也能同步查看。
这款工具支持中英文以及法语、日语等多种语言的识别,经常需要处理外文资料的朋友会比较受用。
易飞文字识别应用场景
移动办公:出差在外没有电脑,用手机拍一张合同照片,App自动识别提取关键条款,直接复制到邮件里发出去。
笔记整理:手写的会议记录拍了照,用易飞识别成电子版,方便以后搜索和编辑。
批量处理:一摞纸质材料需要录入电脑,拍好照片后批量导入网页版,一次性全部识别出来。
VeryCapture功能介绍
VeryCapture是一款免费的屏幕捕获工具,集截图、录屏、OCR识别和翻译于一身。它的设计思路是一个软件搞定所有屏幕相关的需求,用起来很方便。
OCR识别是VeryCapture的一大亮点。用它的截图功能框选屏幕上任意区域,点击OCR按钮就能识别出图中的文字。识别速度很快,准确率也相当不错。更贴心的是,识别出来的文字可以直接点击翻译,系统会自动帮你把外文翻译成中文,省去了再去百度翻译的麻烦。
截图功能方面,VeryCapture支持全屏截图、矩形截图、任意形状截图、延时截图和滚动长截图。滚动长截图尤实用,截网页的时候不用一张一张拼,软件会自动滚动页面并拼接成一张完整的长图。
录屏功能支持GIF动图录制和MP4视频录制。做教程或者记录操作步骤的时候,直接录成GIF发给别人,比截图更直观。
软件界面很清爽,安装后以小图标的形式放在任务栏,双击Ctrl键就能呼出主菜单。所有功能都集中在一个地方,不需要记一堆快捷键。
VeryCapture应用场景
做教程:需要教别人怎么操作某个软件,用VeryCapture录成GIF动图,发送方便对方也容易看懂。
截长网页:看到一个很长的网页想保存下来,用滚动截图功能一次性截完整,不用分成好几张图。
外文资料处理:遇到英文PDF或者图片,截图识别后一键翻译,外语不好的朋友也能快速理解内容。
识字精灵功能介绍
识字精灵是一款专门为离线场景设计的OCR工具,它的特点就是不需要联网。你把软件下载安装后,哪怕电脑断网了也能正常识别图片里的文字。
为什么离线很重要?因为很多在线OCR工具需要把图片上传到服务器才能识别,如果你的文件涉及个人隐私或者商业机密,上传到别人的服务器上存在泄露风险。识字精灵在本地运行,图片不会离开你的电脑,数据安全性更有保障。
识别能力方面,识字精灵可以抓取屏幕上任何不可复制的文本,包括被锁定的PDF文档、扫描件、图片里的文字、甚至视频播放时的字幕。它还会检测原来的文字排版,识别结果会尽量保持原来的段落和换行,读起来比较自然。
操作方式也很便捷,支持热键激活。你可以设置一个快捷键,需要识别的时候按一下快捷键就能调出识别框,不用去点图标找菜单。
识字精灵仅支持Windows 10和Windows 11系统,Windows 7以及更早的版本或者精简版系统无常运行。软件大小只有20多MB,非常轻量。
识字精灵应用场景
保密文档处理:公司内部文件、个人身份信息、合同扫描件等不能外传的内容,用识字精灵离线识别,不用担心泄露。
PDF文字提取:从网上下载的PDF被设置了禁止复制,用识字精灵截取需要的段落,直接识别出来。
视频字幕保存:看网课或者纪录片的时候,字幕想保存下来做笔记,截个图就能识别出文字。
Umi-OCR文字识别工具简介
Umi-OCR也是一款离线OCR工具,在技术爱好者圈子里口碑不错。它和识字精灵类似,都是本地运行、不需要联网的文字识别软件。
这款工具由吾爱破解论坛的开发者制作,免费提供给用户使用。它采用开源的OCR引擎,识别速度和准确率都还可以,日常使用足够了。
Umi-OCR支持批量处理图片文件,你可以把几十张图片一次性拖进去,软件会自动批量识别,识别结果可以导出为TXT文本文件。这对于需要大量录入纸质文档的人来说非常实用。
软件体积小,没有广告,也不会后台偷偷上传数据,用起来比较安心。
| 源码反馈/咨询 (共有 条反馈) |
文字识别工具常见问题
登录QQ后,按快捷键Ctrl加Alt加O,这时候鼠标会变成一个十字形,在屏幕上框选你要识别文字的区域,松开鼠标系统就会自动识别并弹出识别结果窗口。窗口里的文字可以直接复制,也可以点“转腾讯文档”保存成在线文档。如果不想记快捷键,也可以在QQ聊天窗口里点剪刀图标,下拉菜单里有“屏幕识图”选项,效果是一样的。
识字精灵不是大公司开发的商业软件,而是由吾爱破解论坛的技术爱好者个人开发并免费分享给网友使用的。开发者没有注册公司,属于个人作品。这款软件在网上口碑还不错,因为功能实在、免费而且不需要联网。
VeryCapture是一款免费的电脑截图录屏工具,集截图、录GIF、录视频、OCR文字识别、翻译于一体。你可以把它理解成一个屏幕工具箱,任何跟屏幕捕捉有关的操作,用这一个软件基本都能搞定。它支持Windows系统,双击Ctrl键就能呼出功能菜单,操作很方便。
易飞文字识别提供免费版本,基础的OCR文字识别功能不需要付费就能用。网页版免费,没有识别次数限制。手机App和小程序版本也是免费的,适合日常办公使用。不过部分高级功能比如批量导出、云存储空间扩容需要付费订阅,具体价格可以在App里查看。
QQ截图是腾讯QQ软件自带的功能,使用过程中图片会通过QQ的服务器进行处理才能识别文字,这就是联网OCR的工作方式。如果你只是识别一些普通的内容比如文章段落、PPT截图,没问题。但如果截图内容包含个人隐私比如身份证、银行卡、合同等敏感信息,建议用离线的OCR工具,比如识字精灵或者Umi-OCR,这些软件不需要联网,数据不会离开你的电脑。
识字精灵对于有离线OCR需求的用户来说挺好用的。它的优点是无需联网、保护隐私、识别速度快、支持热键调用。而且因为不需要上传图片,识别一张图一两秒就出结果了,比网页版还快。不过也有缺点,它只支持Windows 10和Windows 11系统,Win7用户用不了。另外手写体的识别效果一般,主要还是针对印刷体优化的比较好。
有几个小技巧可以让VeryCapture更好用。把双击Ctrl键呼出菜单的习惯练熟,这样不用去点图标,操作更快。需要识别文字的时候,先截图再点OCR按钮,识别出来的文字可以直接点翻译,不用复制到别的软件里。截长网页的时候记得选滚动截图,软件会自动滚动并拼接,比手动截几张图再拼方便太多了。录GIF的时候如果文件太大,可以在设置里调低帧率,文件体积能小不少。
可以识别手写体,但准确率比印刷体低一些。根据官方数据,印刷体识别准确率能达到百分之九十八左右,手写体大概在百分之九十二左右。手写比较潦草的话识别错误率会更高一些。所以如果你需要经常识别手写笔记或者手写表格,尽量把字写得工整一点,拍照时光线要充足,这样识别效果会好很多。
Umi-OCR非常轻量,安装包只有几十MB,安装在电脑上占用的空间也很小。平时不在使用状态的时候基本不消耗资源。只有在识别图片的时候才会占用一些CPU和内存,但识别一张普通图片一般也就几秒钟的事,对电脑性能的影响可以忽略不计。老旧的办公电脑也能流畅运行。
VeryCapture目前只支持Windows系统,Windows 10和Windows 11都可以正常运行。Mac和Linux用户暂时用不了。如果你是Mac用户,可以考虑用QQ截图或者识字精灵,识字精灵也只有Windows版,Mac的话需要找他替代方案比如Snipaste或者iText。
识字精灵主要是单张识别,每次截取屏幕上的一个区域进行识别。如果你需要批量处理几十张图片,用Umi-OCR会更合适,Umi-OCR支持把多张图片拖进去一次性识别完,所有结果可以导出成一个TXT文件。识字精灵更适合那种少量但需要随时截取识别的情况,比如看PDF时遇到不能复制的段落截一下。
QQ截图识别文字的准确率取决于原图的质量。如果图片清晰、字体端正、背景干净,识别准确率很高,基本不用修改。但如果图片模糊、有噪点、文字歪斜或者背景复杂,识别错误就会比较多。处理普通文档截图、网页截图、PPT截图够用,但扫描的旧书籍或者手机拍的模糊照片就不太行了。
可以识别表格,而且它的表格识别能力还挺强的。易飞的OCR引擎采用了专门的表格识别技术,能够识别出单元格的合并关系,识别后可以导出为Excel格式。不过要注意,简单的单层表格识别效果很好,但如果表格结构特别复杂比如有多层嵌套、跨行跨列很多的情况,识别后需要手动调整一下。