目录
智谱AI输入法与传统的语音输入法不同。传统语音输入法只是把你说的话变成字,而智谱AI输入法背后的GLM-ASR模型和大语言模型能让它“听懂”你的意图并帮你执行任务。
举个例子,你不需要手动输入一串复杂的ffmpeg命令,直接说“把这个视频转成GIF,只要前3秒”,它就能自动生成完整的命令行。你也可以选中一段写得乱七八糟的会议记录,对着它说“帮我润色成正式的工作汇报”,它就会直接替换掉原文。这种“所选即所改”的能力,加上支持中英混输、方言识别、多种人设切换等功能,让它在效率工具中独树一帜。
官网入口地址
https://autoglm.zhipuai.cn/autotyper/
下载地址
https://autoglm.zhipuai.cn/autotyper/ (官网首页即提供下载)
功能介绍
-
高精度语音转写:基于智谱自研的GLM-ASR模型,在复杂环境下的字符错误率仅约7%,对中英混输、专业术语、方言口音都有很好的识别表现。
-
智能润色与改写:选中任意文本后通过语音下达指令,可以要求它“精简一下”“改成面对老板的语气”“翻译成英文”,大模型会直接在原位置替换完成。
-
多风格人设切换:内置了多种表达风格,比如“面对老板”“面对伴侣”“命令行大神”等。同样一句话,在不同人设下输出的措辞和语气不同。
-
语音召唤“小凹”:按住快捷键后直接说出“小凹,帮我查一下北京天气”或“小凹,给我做一个旅游攻略”,它会调用GLM模型完成任务,不只是转写。
-
Voice Coding语感编程:针对开发者设计的功能。说“显示所有python进程”,它输出“ps aux | grep python”;说“查询用户表中年龄大于30岁的”,它直接生成SQL语句。
-
跨应用全局唤起:在任何软件中,只要光标在输入框里,按住快捷键就能唤醒,不需要来回切换窗口。
-
专属热词记忆:在设置里的“词典”中添加你常用的专业名词、项目代号、人名地名,识别会更准。
-
耳语捕捉功能:在图书馆、办公室等不方便大声说话的场合,轻声说话也能精准识别。
应用场景
-
程序员:查遗忘的Linux指令、生成SQL查询、写代码注释,直接说话比打字快得多。
-
创作者与博主:口述灵感自动转成文字,还能一键润色、扩写成适合小红书或公众号的风格。
-
销售与猎头:打完电话后对着电脑说几句,自动生成跟进记录并同步到CRM系统。
-
管理者与HR:会议结束后语音口述纪要要点,自动生成结构化文档,不用自己逐字敲。
-
普通办公族:写邮件、做周报、查资料,能用嘴解决的绝不动手。
定价与权益
智谱AI输入法的核心语音输入功能已全面免费开放,没有任何隐藏收费。 新用户首次使用会获得2000积分,相当于28天的免费体验时长,积分可用于AutoGLM网页端的视频总结等高阶功能。 如果你是GLM Coding Plan的用户,每月首次使用输入法还能额外获得1000积分。
| 源码反馈/咨询 (共有 条反馈) |
智谱AI输入法常见问题
由北京智谱华章科技股份有限公司开发的,这家公司也是大家熟知的“智谱AI”或“清华智普”,就是做ChatGLM大模型的那个团队。
你可以把它理解成一个“能用嘴巴指挥电脑干活”的超级助理。它不只是把你说的变成字,还能听懂你的指令,比如帮你改文章、写代码命令、翻译句子,甚至生成旅游攻略。
安装后用手机号登录,然后按住快捷键说话就行了。Windows电脑按住右Ctrl键或者Alt+空格,Mac电脑按住Fn键,说完松开,文字就自动出现在光标位置。 如果想让它帮你做事,先选中一段文字再按住快捷键发指令,或者说“小凹”加上你的需求。
核心功能永久免费,没有套路。你不需要开会员就能用语音转写、润色、人设切换这些主要功能。 积分只影响一些额外的增值服务,普通用户完全够用。
智谱作为正规公司有完整的隐私政策保护用户数据。 不过需要说明的是,它需要联网使用云端模型才能实现那些智能功能,不像离线输入法那样完全本地化。如果你对数据隐私要求极高,建议留意官方隐私政策中关于数据收集的说明。
第一个技巧是把常用的专业名词提前加到“词典”里,比如你的项目代号或者生僻人名,识别准确率会明显提升。 第二个技巧是善用“人设”切换,写周报时选“面对老板”,发微信时切回“面对伴侣”,一句话自动换语气。第三个是选中文字再说话,这是很多人不知道的隐藏功能。
完全可以,而且这是它的一大亮点。切换到“命令行大神”人设后,你可以直接说“显示所有python进程”,它会输出“ps aux | grep python”;说“查询用户表中年龄大于30岁的”,它生成完整的SQL语句。对经常记不住复杂命令的人来说非常实用。
目前同时支持Windows和macOS两大桌面系统。 移动端的App暂时还没有推出,只能在电脑上用。
占用资源非常少。因为语音识别和智能处理主要是在云端服务器完成的,你的电脑只需要负责录音和显示结果,本地几乎不占CPU和内存,老电脑也能流畅运行。
智谱有完整的隐私政策来保护用户数据。 但需要清楚的是,因为它需要联网把语音传到云端识别,所以确实会经过服务器。如果你输入的是高度敏感信息,建议谨慎使用。普通日常场景下,正规公司的服务是安全的。
官方宣称约97.8%,实际使用下来,在安静环境下普通话的识别确实非常准,中英混输也没问题。 但如果环境嘈杂或者你说话带很重的方言口音,准确率会有所下降。它支持多种方言比如粤语、四川话、东北话等,你可以手动选择对应的语言模式。
对于经常需要打字、写东西、查资料的人来说,习惯了之后真的回不去。尤其是开会记笔记、写邮件、查命令这些场景,效率提升非常明显。不过如果你是那种不喜欢说话、觉得对着电脑说话很尴尬的人,那它可能不太适合你。