博客

按键说话听写:热键语音输入配置指南

为什么按键说话优于持续监听

传统听写工具要么持续监听,要么需要你在特定应用中点击按钮。按键说话改变了这一范式:按住热键,开口说话,松开后,文字便精准出现在光标所在位置。

这种方式解决了语音输入的三个根本问题:

  • 不会误触发转录 —— 麦克风仅在按住热键时激活
  • 无需切换应用 —— 系统级支持,在任何应用中均可使用
  • 无需手动粘贴 —— 文字直接插入光标位置

第一步:安装 Telvr

从官网下载 macOS 版 Telvr。Windows 版本正在开发中。

安装后创建账户,即可获得 EUR 3 初始额度——约 100 分钟的语音输入体验量。

第二步:配置热键

Telvr 默认使用 Option + Space 作为按键说话热键。这个组合符合人体工学(左拇指按 Option,右拇指按 Space),且与常用快捷键基本不冲突。

更改热键的步骤:

  1. 打开 Telvr 偏好设置
  2. 进入热键设置
  3. 点击热键输入框,按下你偏好的组合键
  4. 常用替代方案:Ctrl+Shift+Space、重映射的 Caps Lock,或鼠标侧键

选择热键的建议:

  • 避开常用应用已占用的组合键
  • 选择双手放在主键区时就能触达的按键
  • 使用两键组合,防止误触发

第三步:选择增强模式

Telvr 不只是转录——它会将你的语音通过 AI 增强模式进行处理。开始听写前,根据当前场景选择合适的模式:

  • 清洁校正:删除填充词、修正语法、补全标点。适合日常通用文本。
  • 专业邮件:将语音格式化为带主题行和称呼的专业邮件。
  • 会议记录:将语音整理为含行动项的结构化要点列表。
  • 摘要:将语音压缩为 2–3 句核心内容。
  • 开发任务:格式化为含背景说明和验收标准的结构化任务。
  • 自定义:使用你自己的系统提示词,实现个性化输出。

日常使用中,清洁校正模式能覆盖约 80% 的场景。需要特定格式时再切换相应模式。

第四步:开始听写

工作流很简单:

  1. 将光标放在希望文字出现的位置
  2. 按住热键
  3. 自然地说话——不用担心填充词、停顿或句子是否完整
  4. 松开热键
  5. 等待 1–2 秒处理
  6. 清洁、格式化后的文字出现在光标位置

提高识别效果的说话技巧:

  • 保持正常对话语速
  • 松开热键前把你的意思说完整
  • 在原始模式下,如有需要可明确说出标点符号(例如「逗号」「句号」)
  • 在增强模式下,Telvr 会自动处理标点

第五步:优化工作流

掌握基础操作后,可以进一步提升效率:

  • 批量插入:听写一段,移动光标,继续听写下一段
  • 语音与打字结合:代码或结构化内容用键盘输入,注释和文档用语音
  • 灵活切换模式:将清洁校正设为默认,写邮件时切换到邮件模式
  • 善用语言检测:Telvr 自动识别你的语言——同一会话中可自由切换语言

常见使用场景

邮件回复: 读完邮件,按住热键,口述回复,松开。邮件模式会自动生成带主题行和专业语气的完整邮件。

代码文档: 定位到函数,按住热键,描述这个函数的功能,松开。清洁校正模式输出整洁的文档文字。

会议跟进: 会议结束后,按住热键口述关键决策。会议记录模式会将所有内容整理为结构化的要点和行动项。

快速消息: 在 Slack 或 Teams 中,按住热键,说出消息内容,松开。清洁校正模式会自动去除口语中的「嗯」「啊」等填充词。

常见问题排查

文字没有出现? 检查光标是否处于可编辑的文本框中。Telvr 模拟键盘输入,目标字段必须能接受文字输入。

识别准确率差? 确保麦克风输入清晰。外置麦克风的表现显著优于笔记本内置麦克风。

延迟过高? 检查网络连接。Telvr 在云端处理音频——稳定的网络连接能保证 2 秒以内的响应速度。