目录
平时在网上冲浪或者办公的时候,经常会碰到这种情况:一张图片上有段重要的文字,但没法直接复制;一个YouTube视频的英文字幕想整理成笔记,总不能手打吧。Copyfish就是专门解决这类问题的。
装好这个插件后,浏览器右上角会出现一个小鱼图标。你打开任何包含文字的图片、视频或者PDF文件,点击图标,鼠标会变成一个十字准星,按住左键在屏幕上圈出文字所在的区域。松手之后,Copyfish会自动识别这片区域里的文字,并把识别结果弹出一个窗口显示出来。你可以直接复制,也可以点一下翻译按钮,把识别出来的文字翻译成中文或者他语言。
它用的是云端OCR引擎,识别准确率挺高的,尤是印刷体中文和英文。而且支持超过60种语言,像中、英、日、韩、法、德、俄这些主流语言都没问题。如果你需要从电脑桌面上的任何地方截图取字,比如想提取一个软件的菜单文字或者某个文档里不让复制的段落,可以通过安装配套的桌面组件来实现。
这个插件是开源软件,基于GPL协议发布,源代码公开透明,不用担心后门或者收费。
官网入口地址
下载地址
访问官网后,根据自己使用的浏览器选择对应版本:
-
Chrome版:从官网链接跳转到Chrome网上应用店安装(国内用户需要特殊网络环境)
-
Edge版:从官网链接跳转到Edge扩展商店安装
-
Firefox版:从官网链接跳转到Firefox插件页面安装
如果无法访问谷歌商店,可以尝试在第三方可信的插件下载网站搜索“Copyfish”手动安装crx文件。
功能介绍
核心OCR识别能力
Copyfish的核心功能就是从图像中提取文字。无论是网页上的截图、社交媒体上的图片、PDF文档里的扫描页,还是在线视频的暂停画面,只要文字清晰,它都能识别出来。识别速度在2到5秒之间,取决于网络和图片大小。
超过60种语言支持
支持的语言分两档。第一档引擎支持中文(简繁体)、阿拉伯语、保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、匈牙利语、意大利语、日语、韩语、挪威语、波兰语、葡萄牙语、俄语、西班牙语、斯洛文尼亚语、瑞典语、土耳语。第二档引擎额外支持拉丁语系的各种变体以及泰语、乌克兰语、越南语。
实时翻译功能
识别出文字后,插件窗口里会有一个翻译按钮。你可以设置目标语言,比如把识别出来的英文一键翻译成简体中文。这个功能对于看外语视频字幕、阅读外文图片资料特别有用,省得再开一个翻译网站。
桌面捕获OCR(需要安装辅助组件)
默认情况下Copyfish只能识别浏览器窗口内的内容。如果你需要提取电脑桌面上他软件的文字,比如一个弹窗提示、一个设计软件的菜单栏、或者一个不让复制文字的电子书阅读器,可以额外安装一个叫UI.Vision XModule的小程序。安装后,右键点击Copyfish图标选择“Desktop Text Capture”,就能截取屏幕任意区域的文字。
双击放大查看
识别完成后,有时候识别结果里有个别字不对,是因为原图太小。Copyfish提供了一个功能:双击识别结果窗口中的文本区域,会在新标签页中打开原截图的放大版,方便你对照检查。
免费OCR API供开发者使用
如果你会写代码,Copyfish背后团队还提供了一个免费的OCR API接口。开发者可以调用这个接口在自己的程序里集成图片识字功能。免费版API有每小时200次的调用限制,对于个人项目来说够用。
开源与透明
整个项目源码公开,托管在GitHub上。这意味着任何人都可以去查看代码里有没有偷偷上传隐私数据,也意味着这个插件不会突然变成收费软件,因为社区可以随时fork一份继续维护。
应用场景
从视频里抓字幕
看YouTube的英文教程,讲师说了很长一段话但没提供文字稿。暂停视频,用Copyfish圈一下字幕区域,识别出英文文本,再点一下翻译,就能得到中英文对照的学习笔记。
提取扫描版PDF的文字
有些PDF是扫描图片做的,文字根本选不了。用浏览器打开PDF(或者截图PDF页面),用Copyfish逐段识别,就能把文字复制出来粘贴到Word里重新编辑。
复制网页里的禁选文字
有些资料网站做了防复制,鼠标右键没反应,文字也选不了。这时候用Copyfish直接把那一块区域圈出来识别,文字就到手了。
提取聊天记录截图里的信息
同事发来一张聊天记录截图,上面有几个手机号和地址。一个个照着打太累,用Copyfish识别一下,直接复制粘贴,又快又不会抄错。
翻译外文游戏截图
玩日文游戏或者英文游戏,遇到看不懂的任务说明,截个图用Copyfish识别加翻译,不用退出游戏去开翻译软件。
从设计稿里提取文案
设计师给了一张UI效果图,上面的按钮文字需要整理成文档。用Copyfish逐个圈出来识别,几秒钟就能把图上的所有文字提取出来。
定价及重要信息
定价策略:Copyfish免费。没有任何隐藏收费,也没有专业版需要购买。开源协议保证了这一点,任何人都可以免费和分发。
数据隐私说明:Copyfish是云端OCR服务。你圈选的那块图片区域会被上传到ocr.space的服务器进行文字识别,处理完后服务器不会保存你的图片。如果你对隐私非常敏感,比如要识别包含商业机密或个人身份证件的图片,建议谨慎使用或改用本地离线OCR工具。
技术限制:对手写文字的识别效果一般,用印刷体。背景复杂或者文字太小的图片识别率会下降。另外桌面捕获功能需要额外安装辅助软件,这一点稍微增加了使用门槛。
用户口碑:在Chrome商店有超过3000条评价,总体评分在4.5星左右。用户普遍夸它“简单直接”、“识别中文准确”,吐槽点主要是“偶尔会识别失败需要重试”、“桌面版安装稍微麻烦”。
| 源码反馈/咨询 (共有 条反馈) |
Copyfish常见问题
Copyfish是由一家叫OCR.Space的国外小团队开发的,这个团队专注于OCR光学字符识别技术。他们同时还运营着OCR.Space这个免费的在线OCR网站,以及一个叫UI.Vision的RPA自动化工具。团队不大,但在OCR领域做了很多年了。
可以把它想象成一个浏览器里的“文字吸尘器”。平时我们看到图片上的字、视频里的字,想复制却复制不了,只能自己照着打。装了这个插件之后,点一下图标,用鼠标把那些字圈起来,它就能自动识别出图片里是什么字,然后给你显示出来,你就可以复制或者翻译了。
先说最常见的用法。安装好插件后,打开一个有图片或者正在播放视频的网页,点击浏览器右上角的小鱼图标。这时候鼠标会变成一个十字形状,按住鼠标左键,在包含文字的区域画一个框。松开鼠标,等两三秒钟,屏幕上会弹出一个窗口,里面就是识别出来的文字。你可以直接按Ctrl+C复制走,也可以点窗口里的“翻译”按钮把文字翻译成中文。如果你想抓取电脑桌面上他软件里的文字,比如抓一个弹窗报错的内容,那就需要多一步:先去官网下载安装一个叫UI.Vision XModule的小程序,装好后右键点击小鱼图标,选“Desktop Text Capture”,后面操作就跟网页版一样了。
免费,没有任何收费项目。这个插件是开源的,基于GPL协议发布,这意味着它永远不会突然变成收费软件。不过免费归免费,它用的是云端识别服务,每小时有识别次数的限制,但对普通用户来说一天用几十次够用,不会碰到上限。
算比较可靠,但有几点需要注意。第一它是开源软件,源代码公开,这意味着没有隐藏的恶意代码,这一点比闭源软件更让人放心。第二它的工作原理是把你圈选的图片区域上传到云端服务器进行识别,虽然官方承诺不保存图片,但毕竟图片出了你的电脑。所以不建议用它识别包含身份证号、银行卡、合同扫描件等敏感信息。第三它本身不弹广告,也没有跟踪代码。总体来说是值得信任的,只是别用来处理绝密文件就行。
给你说几个老用户才知道的技巧。第一,键盘快捷键可以提速。点完图标进入截图模式后,按Esc键可以取消操作,不用再点鼠标取消。第二,识别结果弹窗出来后,按Ctrl+C直接就能复制全部文字,不用鼠标去点。第三,如果你经常翻译英文到中文,可以在插件的选项设置里把翻译目标语言预设为中文,这样每次识别完自动出翻译,省一次点击。第四,对于YouTube字幕,可以先暂停视频,等字幕显示出来再圈选,识别率会高很多。第五,识别出来的文字有时候会有多余的空格或者换行,可以粘贴到记事本里用查找替换功能批量处理。
特色的功能就是从视频里抓字幕。别的OCR工具大多只能处理图片,它能直接在播放视频的时候圈选字幕区域提取文字,配合翻译功能看生肉视频很方便。另一个特色是它支持超过60种语言,尤对中日韩文支持得不错。用途方面,学生可以用它从扫描版PDF里提取资料写论文,打工人可以用它把设计图上的文案整理成文档,追剧党可以用它保存经典台词,程序员可以用它免费调用OCR API集成到自己的小工具里。
这事得分两面看。从软件本身来说,它是开源的,代码透明,没有后门,也不会偷偷收集你的浏览记录,这一点是安全的。但从操作过程来说,你圈选的那张图片会被发送到OCR.Space的服务器上去识别,相当于你把图片上传给了第三方。虽然官方说了不会保存图片,传输过程也是加密的,但如果你要识别的是公司内部文件、客户隐私数据、身份证照片这些东西,建议还是别用云端OCR,改用本地离线的OCR软件更稳妥。处理公开的网页图片、视频字幕、普通书籍扫描件这些,用Copyfish没问题。
对于它擅长的场景非常好用,但也不是的。好用的地方在于操作足够简单,点一下圈一下就行,识别结果出来的也快,中文识别率大概能有95%以上,英文更高。不够的地方在于有时候会莫名妙识别失败,尤是网络不太好的时候,需要重新圈一次。另外对手写字体、艺术字、背景特别花的图片识别效果一般。还有一点,它毕竟是个浏览器插件,如果你要批量识别几百张图片,用它会累死,那种情况应该用专业的批量OCR软件。对于日常偶尔从图片视频里抓个几十次字的需求来说,它很好用。
占用极少。它本身就是一个浏览器插件,平时不活动的时候几乎不占内存。只有当你点击图标进行截图识别的时候,它才会启动截图功能,并且把图片上传到云端,这个过程主要在消耗网络流量,CPU和内存占用都很低。就算你安装了配套的桌面组件UI.Vision XModule,那个小程序也只是在截图的时候短暂运行一下,平时不占资源。老电脑可以放心用。
浏览器方面,官方支持Chrome、Edge和Firefox,三个主流浏览器都有对应的插件版本,功能一样。操作系统方面,Windows、macOS、Linux都可以用。因为它是浏览器插件,只要你的系统能跑这些浏览器,就能跑Copyfish。另外桌面截图功能也是全平台支持的,Windows、macOS、Linux都有对应的XModule安装包。不过手机浏览器不支持,手机上想用OCR建议找专门的手机App。
不能。Copyfish需要联网才能工作,因为它用的是云端OCR识别服务。你圈选图片后,插件要把图片上传到OCR.Space的服务器,服务器识别完了再把文字结果传回来。没有网络的话它什么都做不了。如果你经常在无网络环境或者内网办公,需要离线提取图片文字,那得用本地的OCR软件,比如开源免费的Tesseract配合图形界面客户端。