Telvr 如何工作？

按下快捷键，自然说话，Telvr 实时转录。文本直接插入光标所在位置。

支持哪些语言？

通过 Whisper large-v3 支持 50 多种语言。

不需要。按量计费：每月 EUR 3 + 每分钟 EUR 0.03。

目前基于云端。社区版本支持本地部署在规划中。

系统范围，适用任何应用。

TLS 加密，无永久存储，与 Groq 签署数据处理协议。

系统范围，适用任何应用。

语音输入已经超越了简单的听写功能。现代语音转文字工具可以处理多种语言、去除填充词，并智能格式化输出。但哪种解决方案真正适合桌面生产力工作流？

我们对比了三种方案：Telvr（按键说话 + AI 增强）、OpenAI Whisper（开源转录）和系统原生听写（macOS 听写 / Windows 语音输入）。

在安静环境中，所有三种解决方案对英文都能提供很好的基础准确性。差异出现在真实场景中：

Telvr 通过 Groq 的推理 API 使用 Whisper large-v3，准确性与独立 Whisper 接近，但延迟显著降低。AI 增强层自动纠正语法并去除填充词。
Whisper（自托管）提供出色的原始转录，但需要后处理以获得清晰输出。本地运行需要大量 GPU 资源。
原生听写对短语效果很好，但在技术术语、混合语言输入和较长段落中表现不佳。

当语音输入在实时工作流中替代打字时，速度很重要：

这是方案差异最大的地方：

选择 Telvr，如果您希望语音输入在桌面上随处可用，无需复杂设置。AI 增强模式将原始语音转换为格式化的专业文本——这是 Whisper 和原生听写都无法开箱即用提供的功能。

选择 Whisper（自托管），如果您需要完全控制数据，有足够硬件，并且熟悉构建自定义管道。

选择原生听写，用于准确性和格式不是关键的快速、随意语音输入。

最大的差异是集成深度。Telvr 是唯一将转录、AI 处理和系统范围文本插入结合到单个快捷键的解决方案。对于桌面生产力来说，这种集成消除了摩擦力，使其他解决方案看起来像变通方案而不是真正的工具。