软件介绍
评论列表

目录

Handy的诞生背后有一个有趣的故事。开发者CJ Pais因为手指骨折打了石膏,没常打字,想找一个开源的语音转文字工具来应急,结果发现市面上没有合适的。于是他干脆自己动手开发了Handy。

这款软件的核心优势在于离线运行。传统语音输入往往需要将录音上传到云端服务器进行识别,这个过程中音频数据会经过第三方服务器,存在隐私泄露的风险。而Handy把所有识别工作都放在你的电脑本地完成,录音数据不会离开你的设备。

在技术架构上,Handy基于Tauri框架构建,后端用Rust语言编写,前端使用React和TypeScript。这种组合使得软件安装包小巧,运行时内存占用也比较低。它支持CPU和GPU两种运行模式,如果你电脑有独立显卡,可以在设置中开启GPU加速,识别速度会明显提升。

Handy的使用逻辑非常直观:按住快捷键开始录音,松开快捷键软件自动将识别出的文字粘贴到你当前光标所在的位置。整个过程一气呵成,不需要在软件和文档之间来回切换焦点。

官网入口地址

https://handy.computer/

下载地址

https://handy.computer/download

功能介绍

离线语音识别
Handy内置了OpenAI的Whisper系列模型和NVIDIA的Parakeet V3模型。Whisper模型对多语言支持较好,包括中文、日文、英文等都能准确识别;Parakeet V3模型在英文识别上速度更快、准确率更高。用户可以根据自己的需求在设置中切换模型,首次使用某个模型时需要下载,之后就可以离线使用了。

自动语言检测
如果你说话时会混用多种语言,Handy可以自动检测当前使用的语言并进行正确识别。这个功能在多语言工作环境中特别实用。

全局快捷键输入
这是Handy的核心交互设计。用户可以在设置中自定义录音快捷键,按下后软件开始录音,松开后自动将转写结果粘贴到当前活动窗口的光标位置。整个过程不需要切换窗口或点击任何按钮,打字体验非常流畅。

转录历史记录
Handy会保存所有的录音文件和转写结果,用户可以在左侧历史面板中查看之前的转录记录。这对于需要回顾会议内容或整理采访录音的场景很有帮助。

静音过滤功能
软件内置了VAD语音活动检测功能,可以自动过滤掉录音中的静音片段和停顿,让转写结果更加干净利落。

模型灵活切换
用户可以根据自己的电脑配置和使用场景选择合适的模型。Whisper有tiny、base、small、medium、large等多个版本,模型越大识别越准确但对硬件要求也越高。Parakeet V3则针对英了专门优化,速度和准确率都很出色。

应用场景

内容创作者
视频创作者、播客主播可以用Handy快速生成字幕或节目文稿,比手动打字效率高很多。

学生和研究者
听讲座、记笔记时用Handy直接转写,不用边听边打字导致漏听重点内容。整理访谈录音时也可以快速获得文字稿。

会议记录
工作会议中打开Handy,重要发言都能实时转为文字记录,会后整理会议纪要轻松很多。

无障碍输入
对于有打字困难的人士,比如手部受伤、腱鞘炎患者或者老年人,Handy提供了一种省力的输入方式。

多语言工作者
需要频繁输入不同语言内容的人,Handy的自动语言检测功能可以减少手动切换输入法的麻烦。

定价

Handy免费,没有任何隐藏收费。它是一个开源项目,所有人都可以免费下载使用,也可以查看和修改源代码。

源码反馈/咨询 (共有 条反馈)
验证码:

Handy常见问题

本文标签
上一篇:MilkUp
下一篇:JarkViewer