跳到主要内容

电脑端离线语音输入工具

阅读需 2 分钟

前几天进行了 DeepSeek 的本地搭建,其中尝试使用本地 AI 来提高编码效率。

因为需要给 AI 描述我的想法,而讲话是比打字快的多的,所以我希望在电脑端运行离线语音输入工具,重点是离线。

一、工具

1. 讯飞

讯飞输入法是在语音输入是有一席之地的,但我并不想使用其输入法,我用不到那么多功能。所以我找到了它的语音输入独立版,就是将讯飞输入法软件中的语音输入模块,单独拎出来执行,移除其它模块。

非常干净,但问题是,它不是离线的。无奈,舍去。

2. CapsWriter-Offline

离线语音输入,还是得依靠模型。

最后发现了一款开源软件 HaujetZhao/CapsWriter-Offline:CapsWriter 的离线版,一个好用的 PC 端的语音输入工具。作者已经构建好了,开箱即用。

B站视频使用教程:CapsWriter-Offline 电脑端离线语音输入工具,作者讲的很详细,参考即可。

这个软件就是典型的模型应用了,做得很好。综合考虑之后,我就直接使用这个软件了,满足需求。

题外话

  1. 软件是CS架构(客户端和服务端),AMD 3600 启动服务端大概是 45s,启动客户端大概是 1s 内。

  2. 软件依靠 CPU 解析语音,而不是依靠显卡。如果对文字返回有一定实时要求,CPU 需要好一些,否则会有明显的延迟。

    • ① AMD 5600G 启动服务端大概是 30s,比 3600 快了大概 15s。
    • ② 服务端在处理语音信息时,CPU 性能曲线有一个明显的峰值。
  3. 软件内存占用并不多。

二、最后

使用 CapsWriter-Offline 即可实现需求。

暂时未加入评论功能,请在对应公众号文章下或 GitHub Issues下留言反馈。