Umi-OCR：断网也能用的高精度文字识别神器，守护你的数据隐私-代码号

Name: Umi-OCR - 代码号
Author: 原创

软件介绍

评论列表

在日常生活和工作中，我们经常需要从图片、扫描件或PDF中提取文字。使用在线的OCR工具虽然方便，但往往需要把包含身份证、合同等隐私信息的图片上传到别人的服务器，这带来了不小的安全隐患。Umi-OCR的出现，地解决了这个痛点。

这款由个人开发者hiroi-sora发起并持续维护的开源项目，凭借“离线运行”和“高精度识别”两大核心优势，在GitHub上收获了超过36K的星标，成为了开源OCR领域的明星项目。它采用先进的深度学习算法，不仅能准确识别常见的印刷体，对手写体、竖排文字也有不错的支持。软件界面简洁直观，解压即可使用，无需复杂的安装配置，让你在享受便捷的同时，牢牢掌握数据的主动权。

官网入口地址

Umi-OCR目前没有独立的官方网站，官方信息和发布地址主要在代码托管平台：
GitHub: https://github.com/hiroi-sora/Umi-OCR
Gitee: https://gitee.com/yongyuan/Umi-OCR

下载地址

你可以通过以下渠道下载版本：
蓝奏云（国内推荐，免注册/无限速）：https://hiroi-sora.lanzoul.com/s/umi-ocr
GitHub Releases: https://github.com/hiroi-sora/Umi-OCR/releases/latest
SourceForge: https://sourceforge.net/projects/umi-ocr

功能介绍

Umi-OCR不仅仅是一个简单的截图识字工具，它围绕“离线OCR”构建了一套功能丰富的实用工具箱。

核心OCR识别引擎：软件基于PaddleOCR-json C++识别引擎构建，提供了两种主流引擎插件版本供用户选择。Paddle引擎版性能好、速度快，适合配置较高的电脑；Rapid引擎版速度稍慢但内存占用低，兼容性更好，适合低配机器或不兼容Paddle的CPU。用户可以根据自己的硬件情况灵活选择。

多种识别模式：

截图OCR：这是最常用的功能。你可以设置一个全局快捷键（默认为F4），按下后即刻截取屏幕任意区域，软件会立即识别中的文字并显示在结果窗口中，支持对识别结果进行排版优化，如“按自然段换行”或“保留缩进”。
批量图片OCR：支持一次性拖拽导入数百张JPG、PNG等格式的图片。软件会自动排队处理，并将识别结果导出为TXT、JSON、MD或CSV等多种格式，非常适合大量文档的数字化工作。
文档处理：可以直接识别PDF、XPS、EPUB等格式的扫描件。不仅能提取中的文字，还能将扫描版PDF转换为双层可搜索PDF，即上层为可复制搜索的文字，下层保留原始图像，极大方便了电子文档的归档和查阅。

智能工具与高级功能：

二维码/条形码工具箱：支持识别图片中的二维码和条形码（甚至一张图里的多个码），同时也能根据你输入的内容生成二维码。
数学公式识别：针对手写或印刷的数学公式，可以将一键转换为LaTeX代码，对学术研究人员和学生来说非常实用。
排除干扰区域：在处理带有水印或固定干扰项的图片时，你可以在软件中框选一个“忽略区域”，识别时会自动跳过该区域，只提取干净的文字。
灵活调用接口：除了图形界面，Umi-OCR还提供了命令行（CLI）和HTTP接口，方便开发者将集成到自己的自动化脚本或应用程序中。

应用场景

个人隐私保护：当你需要识别身份证、银行卡、户口本等包含极敏感个人信息的证件时，使用Umi-OCR可以避免将照片上传到云端，从源头上杜绝数据泄露风险。

企业文档数字化：金融、法律、医疗等对数据安全有严格合规要求的行业，可以使用Umi-OCR在内网离线环境中批量处理合同、病例、档案，既提高了录入效率，又确保了数据不出境。

学术与研究：研究人员可以将大量的PDF论文、古籍扫描件通过Umi-OCR转换成可搜索的文档，或者将复杂的公式截图识别为LaTeX，方便在论文中直接引用和编辑。

日常办公学习：学生和上班族可以用它快速摘录截图中的文字、整理会议笔记、从网页或视频截图中提取无法复制的文本信息，是提升信息处理效率的好帮手。

主要信息补充

定价策略：Umi-OCR是一款基于MIT开源协议发布的软件，这意味着它免费，用户可以自由使用、修改甚至进行商业化应用，无需支付任何费用。

安全性与隐私：软件的所有OCR处理均在用户本地计算机上完成，无需任何网络连接。图片数据不会上传，也不会有任何日志记录离开你的电脑，真正实现了“零数据外传”。

开发者与社区：项目由核心开发者hiroi-sora维护，并在GitHub上开源。活跃的社区为软件的多语言翻译、问题修复和功能改进做出了贡献，已有志愿者帮助软件兼容了Linux平台。

源码反馈/咨询（共有条反馈）

Umi-OCR常见问题

Umi-OCR是哪个公司开发的？

Umi-OCR的网页版在线使用入口在哪里？

Umi-OCR到底是什么软件？

Umi-OCR到底怎么用？操作复杂吗？

Umi-OCR是免费的吗？会不会用着用着就要收费？

用这种离线OCR软件安全吗？我的照片会泄露吗？

有没有什么高效使用的技巧可以分享一下？

除了识别文字，它还有什么特别实用的特色功能？

用Umi-OCR识别图片里的文字，准确率怎么样？

Umi-OCR好用吗？和那些在线识别的网站比起来有什么优势？

本文标签

工具推荐

Quicker

Quicker是一款为Windows用户量身打造的效率神器。它通过一个可随时呼出的快捷面板，将你常用的操作、软件、脚本和自动化流程汇聚于指尖。无论是快速启动程序、执行重复操作，还是实现复杂的跨软件数据传递，Quicker都能帮你一键完成。庞大的动作库拥有超过8000个由社区分享的动作，让每个人都能站在巨人的肩膀上提升效率。