返回首页

如何创建自定义输出格式

什么是输出格式?

当您对着 Telvr 说话时,会发生两件事。首先,您的语音由 Whisper(最准确的语音识别模型之一)转录。其次,该原始转录文本会经过 AI 增强步骤,转换为格式化、结构化的文本。

输出格式是控制第二步的指令。它们告诉 AI 应该是什么样的作者、如何表现、输入上下文是什么、最终结果应该是什么样子。从技术上讲,输出格式是系统提示词——AI 在处理您的转录之前读取的一组指令。

Telvr 内置了六种输出格式,可覆盖最常见的用途:

  • 清理 — 删除填充词、修正语法、生成干净的文本
  • 邮件 — 将听写内容结构化为专业邮件,包括主题行和问候
  • 会议记录 — 将口述内容整理为决策、行动项和下一步
  • 摘要 — 将较长的语音压缩为 2-3 句话的摘要
  • 提示词 — 将口述想法结构化为开发任务,包括需求和验收标准
  • 自定义 — 您自己的输出格式,从零开始编写

自定义模式是输出格式发挥强大功能的地方。它允许您为任何工作流定义自己的模板——日常站会更新格式、法律备忘录听写、客户支持响应、社交媒体文案或任何其他您定期听写的内容。


4 部分模板结构

每个输出格式模板都遵循一致的 4 部分结构。每部分都有特定的目的,加在一起可以为 AI 提供生成可靠、高质量输出所需的全部内容。

角色

角色部分定义了 AI 在此模板中的身份。将其视为聘请专家:您告诉 AI 应该依靠什么样的专业知识,以及应该采取什么样的角色。

# Role
You are a professional email writer who converts spoken messages into well-structured, polished emails.

定义良好的角色会影响整个输出。被告知是"专业电子邮件作者"的 AI 会自动默认采用适当的风格、格式约定和词汇选择,而无需对每个细节进行明确指示。"简洁的技术作家"这样的角色自然会青睐准确性和简洁性。

将角色限制在一两句话内。以清晰的语言说明专业领域和核心任务。

指令

指令部分是定义规则的地方。这是最重要的部分——它告诉 AI 确切地做什么、避免什么,以及在遇到边界情况时如何表现。

将指令格式化为要点列表。每个要点应描述一个单一、清晰的规则。

无论目的如何,三条规则属于每个模板:

# Instructions
- [Your task-specific rules here]
- Respond in the same language as the input text.
- Do not add explanations, headers, or meta-commentary.
- Do not wrap output in markdown code blocks.

最后三个是通用默认设置。"以与输入相同的语言响应"确保您的输出与您听写的语言相匹配——如果您在语言之间切换,这很关键。"无解释或元评论"防止 AI 在实际输出之前添加"这是您的电子邮件:"之类的内容。"不包装在 markdown 代码块中"防止输出被包装在三个反引号中。

您可以根据需要添加任意数量的任务特定规则,但目标是总数少于十条。超过这个数字,规则会开始相互冲突。

上下文

上下文部分提供有关情况的背景信息。它是可选的——并非每个模板都需要它——但它可以帮助 AI 处理听写输入的特殊情况。

# Context
The user dictates messages via push-to-talk. Input may contain filler words, repetitions, and incomplete sentences.

上下文在以下情况下很有用:

  • 输入具有 AI 应该考虑的可预测特征(填充词、不完整的句子、特定领域的术语)
  • 输出将用于具有隐含约定的特定环境(公司 Slack、法律文档系统)
  • AI 需要了解说话者和预期接收者之间的关系

如果您的用例很直接,指令部分已经涵盖了一切,则完全跳过上下文部分。

预期输出

预期输出部分描述最终结果的形状。它告诉 AI 要生成什么格式、长度和结构。

# Expected Output
A professional email with:
- Subject line
- Greeting
- Body (1-3 paragraphs)
- Professional sign-off

此部分充当质量目标。AI 将构建其输出以匹配您在此描述的内容。如果您想要特定的格式——要点列表、编号步骤、特定标题结构——在此处明确描述它。


空白模板

使用此作为任何新输出格式的起点:

# Role
[Describe the assistant's expertise and persona.]

# Instructions
- [Primary task instruction]
- [Additional requirement]
- [Formatting preference]
- Respond in the same language as the input text.
- Do not add explanations, headers, or meta-commentary.
- Do not wrap output in markdown code blocks.

# Context
[Optional background information. Remove if not needed.]

# Expected Output
[Describe what the output should look like.]
Download Blank Template

最佳实践

来自提示工程的六项原则,直接适用于输出格式模板:

1. 对数量和约束具体说明。 "用 2-3 句话写"优于"保持简短"。"最多使用 5 个要点"优于"保持简洁"。模糊的指令为 AI 以可能不符合您意图的方式解释它们留下空间。

2. 用两个参考点定义语气。 "专业但友好"比仅仅"专业"更有用,因为它定义了下限和上限。类似地,"正式但不僵硬"或"随意但不轻浮"为 AI 提供了一个范围,而不是一个单一的模糊目标。

3. 在预期输出中包含示例。 显示而不仅仅讲述。如果您想要特定的格式,请从结构上描述它,并在有帮助时包含一个小示例。"以动作动词开头的主题行,例如'请求:周五前的服务器访问权限'"比"好的主题行"更清晰。

4. 用不该做什么明确设置边界。 三条通用默认规则已经涵盖了最常见的问题,但您的模板可能需要额外的边界。如果您的听写经常包含切线,添加"不包括与主要请求无关的内容"。如果您想要干净的输出,不带任何格式字符,请添加"不要使用要点或标题"。

5. 让每个模板专注于一项任务。 试图处理电子邮件会议记录摘要的模板会将每个处理得都很差。一个模板,一个输出类型。如果您有多个不同的用途,请创建多个模板并通过点击在它们之间切换。

6. 从简单开始并迭代。 编写只有三或四条规则的第一个版本,并对真实听写进行测试。仅在遇到输出中的特定问题时才添加规则。包含 15 条规则的过度设计的模板通常比精简的 5 条规则的模板表现更差,因为规则开始相互矛盾。


示例:博客文章草稿

# Role
You are a content writer who transforms spoken ideas into blog post drafts.

# Instructions
- Convert the spoken input into a structured blog post draft.
- Add a compelling title.
- Break the content into logical sections with subheadings.
- Maintain a conversational but informative tone.
- Respond in the same language as the input text.
- Do not add explanations, headers, or meta-commentary.
- Do not wrap output in markdown code blocks.

# Expected Output
A blog post draft with:
- Title (H1)
- 2–4 sections with subheadings (H2)
- 200–400 words total

此模板对于大声思考的内容创建者很有用。您以意识流风格说出您的想法;模板将它们塑造成可发布的草稿结构。


示例:Slack 消息

# Role
You are a concise communicator who converts spoken messages into Slack-appropriate messages.

# Instructions
- Keep messages brief and scannable.
- Use emoji sparingly but naturally.
- Break longer messages into short paragraphs.
- If the message contains action items, format them as a checklist.
- Respond in the same language as the input text.
- Do not add explanations, headers, or meta-commentary.
- Do not wrap output in markdown code blocks.

# Expected Output
A casual but clear Slack message, 1–3 short paragraphs maximum.

此模板反映了 Slack 通信的规范:短段落、偶尔的表情符号和必要时清晰的行动项。清单指令仅在相关时激活——AI 将识别您的消息何时包含任务并相应地进行格式化。


常见错误

1. 过于模糊 "让它更好"或"改进文本"对 AI 没有方向。输出格式效果最好具体、可操作的指令。如果您无法表达"更好"的含义,AI 也无法。

2. 过多规则 包含 20 条指令的模板会产生内部冲突。当一条规则说"简洁",另一条说"包括完整上下文"时,AI 必须猜测哪个优先级更高。将规则数量保持在十以下,并明确解决任何冲突。

3. 遗漏语言规则 始终包括"以与输入相同的语言响应"。没有它,AI 可能会默认为英语,无论您用什么语言听写。这特别重要,如果您根据上下文在语言之间切换——向法国同事发送 Slack 消息、向德国客户发送电子邮件。

4. 忘记预期输出 没有预期输出部分,AI 会猜测结构。有时它猜对了。通常它会产生相似输入之间的不一致结果。明确描述所需的输出格式可以消除该差异。

5. 从一开始就过度设计 新用户有时会尝试在测试任何东西之前预期每个边界情况。编写捕捉您意图的最简单版本,对十个真实听写运行它,并仅为您实际观察到的问题添加规则。模板是迭代的——它们随着使用而改进。


开始使用

下载下面的空白模板,打开 Telvr,将其粘贴到自定义模式模板字段中。从角色和几条指令开始,然后针对来自您工作流的真实听写进行测试。最有用的模板是从少数几次迭代中出现的:编写、测试、改进。

空白模板属于您塑造。Telvr 会处理其余的。

Download Blank Template