Telvr 如何工作？

按下快捷键，自然说话，Telvr 实时转录。文本直接插入光标所在位置。

支持哪些语言？

通过 Whisper large-v3 支持 50 多种语言。

不需要。阶梯式预付费模式：高用量时低至 EUR 0.003/分钟，初始 EUR 0.03/分钟。EUR 3 月最低消费（从用量中扣除）。无合约，无自动续费。

支持离线使用吗？

目前基于云端。社区版本支持本地部署在规划中。

支持哪些应用？

系统范围，适用任何应用。

TLS 加密，无永久存储，与 Groq 签署数据处理协议。

← 博客2026-02-12

无障碍文本输入：面向运动障碍用户的语音输入

Q: 支持哪些应用？

系统范围，适用任何应用。

文本输入的无障碍困境

数字通信默认用户能够使用键盘。电子邮件、文档、聊天、代码、表单——几乎所有数字工作流程都需要持续的文本输入。对于无法舒适或根本无法使用键盘的用户而言，这一前提构成了根本性的障碍。

影响文本输入的运动障碍种类繁多：因过度使用导致的重复性劳损（RSI）、影响手部关节的关节炎、特发性震颤、限制手部运动的脊髓损伤、神经系统疾病，以及术后康复期。具体的限制因人而异，但核心问题相同：标准键盘输入对他们而言是痛苦的、受限的，甚至是完全不可能的。

语音输入并不能解决所有无障碍挑战，本文也不会如此声称。它能做到的，是为许多人提供一个有意义的替代文本输入渠道，从而恢复他们参与数字通信的能力。

语音输入能带来什么

文本输入的独立性

对于单手打字或因身体状况导致打字速度极慢的用户而言，语音输入能够让他们以接近正常对话的速度书写。说话速度（每分钟 130–160 个词）与打字速度（对于手部活动受限的用户可能只有每分钟 5–20 个词）之间的差距，不是抽象的效率数字——它决定了一个人能否参与实时的 Slack 对话，还是根本跟不上节奏。

减轻身体负担

重复性劳损是采用语音输入最常见的原因之一。当打字引发疼痛时，通常的建议是减少打字量。语音输入让工作得以在正常产出水平上继续，同时将文本内容产生的击键负担降低至接近于零。

对于开发者、写作者、律师以及其他以文字工作为主的人来说，在减轻身体负担的同时维持正常产出，不仅是效率上的优化——有时更是能否继续工作的关键。

全系统覆盖

语音输入作为真正无障碍工具的关键要求，是它能在任何地方工作。仅支持 Gmail 或仅支持 Microsoft Word 的应用专属语音工具，充其量只是局部解决方案。需要文本输入的场景包括：

电子邮件客户端
代码编辑器和终端
聊天应用（Slack、Teams、Discord）
网页表单
文档编辑器
行政管理软件
密码框和身份验证

全系统文本插入——语音工具无论当前哪个应用处于激活状态，都能在光标位置插入文字——才能让语音输入成为完整的键盘替代方案，而不仅仅是有限的补充工具。

AI 增强作为无障碍功能

AI 文本增强通常被定位为生产力优化工具。对于以语音作为主要输入方式的用户而言，它更应被理解为一种格式化无障碍功能。

说话是自然的，但口语和书面语之间存在差异。口语包含口误、不完整的句子以及反映人们口头思维和表达方式的非正式用语。如果没有增强处理，弥合所说内容与规范书面文本之间的差距就需要手动编辑——这又重新引入了语音输入本应消除的打字负担。

AI 增强填补了这一差距。当口语自动转化为整洁的散文、会议记录、专业邮件或结构化任务时，用户的意图就能直达目的地，无需再编辑转录内容。

这对那些正是为了减少打字而采用语音输入的用户尤为重要。如果每封口述的邮件都需要在键盘上花十分钟整理，这个工具就只解决了一半的问题。

语音输入与不同运动障碍

重复性劳损（RSI）

因打字引发的 RSI 是一个渐进过程。大多数出现症状的人都有多年高强度键盘使用史。语音输入在 RSI 发展初期作为预防手段最为有效，或者在打字已经引发疼痛后作为主要输入方式。

实际注意事项： 即使以语音为主要输入方式，通常仍需要一定量的键盘操作用于导航、编辑和精确输入（密码、代码、电子表格公式）。RSI 的目标是减少总击键量，而非完全消除键盘使用。

有效方法： 按键说话（Push-to-Talk）模式将文本内容的键盘工作量降至接近于零，同时仍允许使用键盘进行导航和精确操作。

关节炎

影响手部关节的关节炎使打字在机械层面产生疼痛。精细的手部动作对于准确的键盘输入变得越来越困难。语音输入是自然的补充——按键说话模式只需要粗略的运动控制（按住一个键），或者连续听写模式完全无需身体输入。

注意事项： 对于连按住热键都感到困难的关节炎用户，持续听写或语音命令激活模式可能比按键说话更实用。

特发性震颤

震颤影响打字的准确性和速度。语音输入基本消除了文本内容的准确性问题，但导航和编辑仍需要鼠标、键盘或其他辅助导航工具。

脊髓损伤与瘫痪

对于上肢活动能力受限更为严重的用户，语音输入是一个更广泛的辅助技术生态系统的一部分，该系统通常还包括眼动追踪、开关控制和专用鼠标。

在这种情况下，全系统语音文本输入只是其中一个组件，而非完整解决方案。语音文本输入与其他辅助技术设备的集成——确保通过语音口述的文字在眼动追踪导航控制下能正确显示——是实际配置中需要考虑的问题。

为无障碍需求配置语音输入

在按键说话与连续模式之间选择

按键说话（如 Telvr）需要按住一个键来激活。对于希望明确控制输入时机、且能舒适地按住单键的用户来说，这种方式很合适。

连续/持续听写更适合无法舒适地按住键、有免提需求或全天语音输入量很大的用户。

macOS 的 Apple 听写和 Windows 语音输入均支持连续听写模式。Telvr 的按键说话设计针对的是有意识、有边界的听写，而非全天持续使用。

麦克风摆放

对于用户可能处于特定位置（轮椅、特殊桌面配置）的无障碍场景，麦克风摆放至关重要：

头戴式麦克风： 无论头部位置如何，与口部保持一致距离。对于体位灵活性有限的用户最为可靠。

定向桌面麦克风： 可朝向用户方向摆放。适合固定位置的桌面使用。

领夹式麦克风： 夹在衣服上，位置稳定，方便在不同体位之间移动的用户使用。

macOS 上的辅助功能权限

Telvr 需要辅助功能权限才能执行全系统文本插入。这与 macOS 上其他辅助技术工具所用的权限类别相同。请在系统设置的「隐私与安全性」下的「辅助功能」中授予此权限。

语音输入无法替代的内容

诚实的无障碍指导需要承认局限性：

代码语法： 逐字符口述编程语法并不实际。语音编程适合文档和散文，不适合源代码本身。
编辑与导航： 选择文本、移动光标、在文档界面中导航——这些仍需要鼠标、键盘或其他导航工具。
精确输入： 密码、公式中的数字、技术标识符——准确率较高但并不完美。关键的精确输入建议进行视觉确认。
嘈杂环境： 背景噪音会降低准确率。对于对环境控制能力较弱的无障碍用户而言，麦克风质量变得更加重要。

更宏观的视角

语音输入作为无障碍计算配置的一个组件最为有用，而不是解决所有输入挑战的单一解决方案。与配置良好的鼠标替代方案、操作系统无障碍功能以及应用程序键盘快捷键相结合，它能大幅降低许多用户在文本输入上的身体和认知负担。

由现代 AI 模型驱动的高精度、低延迟语音工具的出现，使这一选项比以往任何时候都更加实用。对于那些打字痛苦、缓慢或根本不可能的用户而言，2026 年可用的工具比五年前有了实质性的提升——而这一差距还在持续缩小。