Telvr는 어떻게 작동하나요?

단축키를 누르고 자연스럽게 말하면, Telvr가 실시간으로 Whisper를 사용해 음성을 전사합니다. 텍스트가 커서 위치에 자동으로 입력되어요 — 복사-붙여넣기, 앱 전환 없이.

어떤 언어를 지원하나요?

Whisper large-v3를 통해 50개 이상의 언어를 지원합니다. 언어는 자동으로 감지돼요.

구독이 필요한가요?

아니요. 단계별 선불 모델입니다. 높은 사용량 시 분당 EUR 0.003부터, 시작 시 EUR 0.03/분. 월 최소 EUR 3 (사용량에서 차감). 약정 없음, 자동 갱신 없음.

오프라인으로 사용할 수 있나요?

현재는 클라우드 기반입니다. Community Edition이 계획 중이에요.

어떤 앱에서 사용할 수 있나요?

시스템 전체, 모든 애플리케이션에서 사용 가능해요.

데이터는 안전한가요?

TLS 암호화, 음성 데이터 영구 저장 없음, Groq DPA 준수.

← 블로그2026-02-25

Mac용 음성 텍스트 변환: 모든 옵션 비교 (2026)

2026년 macOS의 음성 입력

macOS는 항상 강력한 음성 입력 기반을 갖추고 있었습니다. Apple은 OS X Mountain Lion과 함께 서버 기반 Dictation을 도입했으며, Mac의 긴밀한 하드웨어-소프트웨어 통합 덕분에 서드파티 도구도 시스템 깊숙이 연결될 수 있습니다. 2026년 Mac 사용자는 5년 전이라면 공상 과학처럼 보였을 도구를 포함하여 그 어느 때보다 많은 음성 입력 옵션을 갖게 되었습니다.

문제는 어떤 옵션이 실제로 나의 워크플로우에 맞는지 아는 것입니다. 이 비교는 Mac의 모든 관련 옵션을 다루며, 각 옵션이 잘하는 것과 부족한 것에 대한 솔직한 평가를 제공합니다.

Apple Dictation (내장)

Apple Dictation은 비용이 없고 설치가 필요 없기 때문에 가장 먼저 평가해야 할 옵션입니다. 시스템 설정의 키보드에서 활성화하고 단축키를 지정하면(기본값은 fn을 두 번 누르기 또는 받아쓰기 키) 바로 사용할 수 있습니다.

작동 방식: 짧은 구절은 Apple의 음성 모델을 사용하여 기기에서 처리합니다. 더 긴 받아쓰기 세션은 선택적으로 Apple 서버를 사용할 수 있습니다. 출력은 실시간으로 활성 텍스트 필드에 나타납니다.

정확도: 깨끗한 환경의 영어에서 강력합니다. 일상적인 대화체를 잘 처리하지만 전문 용어, Apple의 사전에 없는 고유 명사, 코드 관련 어휘에서 어려움을 겪습니다.

서식화: 명령으로 명시적으로 말할 때를 제외하고 기본 구두점 이상은 없습니다. AI 강화가 없습니다. "음" 또는 "마치"라고 말하면 그 단어들이 텍스트에 나타납니다.

개인 정보 보호: 짧은 구절의 기기 내 처리는 진정으로 비공개입니다. 서버 처리는 Apple에 오디오를 전송합니다.

최적: 일상 앱에서의 가끔씩 받아쓰기, 아무것도 설치하고 싶지 않은 사용자, 서식화가 중요하지 않은 빠른 음성 입력.

Telvr

Telvr는 macOS 전용 푸시 투 토크 받아쓰기 앱입니다. 메뉴 바 앱으로 설치되어 AI 강화가 포함된 시스템 전체 음성 입력을 제공합니다.

작동 방식: Mac의 어디서든 — 어떤 앱이든, 어떤 텍스트 필드든, 심지어 터미널에서도 — 설정 가능한 단축키를 유지합니다. 내용을 말하고, 키를 놓으면, 약 2초 이내에 처리된 텍스트가 커서 위치에 정확하게 나타납니다.

처리 파이프라인은 전사를 위해 Groq 추론 API를 통한 Whisper large-v3를 사용하고, 이어서 원본 음성을 서식이 갖춰진 출력으로 변환하는 AI 강화 단계가 따릅니다.

6가지 강화 모드:

원본 전사: 최소 처리된 정확한 발화 출력
정리 및 교정: 군더더기 제거, 문법 교정, 구두점 추가
전문 이메일: 제목과 인사가 포함된 완전한 이메일로 변환
회의록: 결정 사항과 액션 아이템이 있는 글머리 기호 구조로 변환
2~3문장 요약: 더 긴 발화를 간결한 요약으로 압축
개발 작업: 맥락과 완료 기준이 있는 개발 작업으로 구조화

정확도: Whisper large-v3는 현재 사용 가능한 가장 정확한 모델 중 하나입니다. 문법을 교정하고 군더더기를 제거하는 강화 레이어와 결합되어 출력 품질이 원본 전사 도구보다 일관적으로 높습니다.

지연 시간: 일반적인 구절에서 2초 미만입니다. Groq의 최적화된 추론을 통한 클라우드 처리는 지연이 "버퍼링"이 아니라 "생각하는" 느낌을 줄 만큼 빠릅니다.

언어 지원: 자동 감지와 함께 50개 이상의 언어를 지원합니다. Telvr는 언어를 설정할 필요 없이 발화에서 감지합니다.

가격: 월 EUR 3 월간 최소 요금(사용량에 포함됨) + 실제 받아쓰기 분당 EUR 0.003부터. 14일 무료 체험에 EUR 3 시작 크레딧 포함.

최적: 수동 편집 없이 깔끔하고 서식이 갖춰진 출력을 생성하는 시스템 전체 음성 입력을 원하는 전문가.

Wispr Flow

Wispr Flow는 macOS에서 Telvr에 가장 가까운 경쟁 제품입니다. 동일한 푸시 투 토크 방식을 취하며 AI 처리를 추가하여 깔끔한 출력을 생성합니다.

장점: 세련된 인터페이스, 탄탄한 AI 출력 품질, 그리고 자연스러운 일시 정지가 있는 더 긴 받아쓰기 세션을 더 우아하게 처리하는 "플로우 모드".

가격: 월 $14 정액제. 이는 하루 30분 이상 받아쓰는 헤비 사용자에게는 유리하고, Telvr의 사용량 기반 모델에 비해 중간 사용자에게는 불리합니다.

한계: 커스텀 프롬프트 모드 없음. Whisper 기반 도구보다 언어 지원이 협소합니다.

최적: 매일 많은 양의 받아쓰기를 하고 예측 가능한 월정액을 선호하는 Mac 사용자.

Whisper (자체 호스팅)

OpenAI의 Whisper 모델은 오픈소스 프로젝트로 제공됩니다. 적절한 도구를 사용하면 Apple Silicon Mac에서 로컬로 실행할 수 있습니다.

작동 방식: sox나 whisper-mic 같은 래퍼로 오디오를 녹음하고, 로컬 Whisper 모델로 처리하면 전사본을 얻습니다. 클라우드 API가 필요 없습니다.

정확도: Telvr의 전사 품질과 동일합니다 — 동일한 Whisper large-v3 모델입니다. 차이는 전적으로 파이프라인과 강화 레이어에 있습니다.

지연 시간: Apple Silicon(M2/M3/M4 칩)에서 Whisper large-v3는 로컬에서 3~8초에 실행됩니다. 소형 모델(medium, small)은 일부 정확도 감소와 함께 1~3초에 실행됩니다.

통합: 기본 제공 없음. 활성 애플리케이션에 텍스트를 삽입하는 커스텀 파이프라인을 구축해야 합니다. 여러 커뮤니티 프로젝트(whispering, MacWhisper 등)가 있지만 설정이 필요합니다.

강화: 전혀 없습니다. 원본 전사만 제공합니다. 후처리에는 추가 도구가 필요합니다.

개인 정보 보호: 완전히 로컬입니다. 오디오가 기기를 떠나지 않습니다.

최적: 완전한 제어를 원하는 개발자, 개인 정보 보호를 중시하는 사용자, 커스텀 워크플로우를 구축하는 사람.

Dragon for Mac (단종)

Mac용 Dragon NaturallySpeaking은 2023년 Nuance에 의해 단종되었습니다. macOS에서 현재 버전을 사용할 수 없습니다. Dragon 수준의 정확도와 어휘 관리가 필요하다면 Telvr, Wispr Flow 또는 자체 호스팅 Whisper를 선택해야 합니다.

이 점은 많은 검색 결과가 여전히 Mac용 Dragon을 참조하기 때문에 언급합니다 — 더 이상 macOS 사용자에게 유효한 선택이 아닙니다.

비교표

| 기능 | Apple Dictation | Telvr | Wispr Flow | Whisper(로컬) | |---|---|---|---|---| | 시스템 전체 | 예 | 예 | 예 | 커스텀 설정 필요 | | AI 강화 | 없음 | 있음(6가지 모드) | 있음 | 없음 | | 지연 시간 | 1~3초 | 2초 미만 | 2초 미만 | 3~8초 | | 언어 지원 | ~60 | 50+(자동 감지) | ~40 | 99 | | 개인 정보 보호 | 기기 내 처리 옵션 | 클라우드 | 클라우드 | 완전 로컬 | | 가격 | 무료 | EUR 3/월 + 사용량 | $14/월 | 무료 | | 커스텀 프롬프트 | 없음 | 있음 | 없음 | 없음 |