Windows 음성 입력 옵션
Windows는 다른 어떤 데스크톱 플랫폼보다 많은 음성 인식 옵션을 제공합니다. 완전히 무료인 내장 도구부터 엔터프라이즈급 전문 소프트웨어까지 다양합니다. 올바른 옵션을 설정하는 데는 필요에 따라 2분에서 반나절까지 걸릴 수 있습니다.
이 가이드는 세 가지 수준을 다룹니다. 즉시 사용 가능한 내장 Windows 음성 입력, 전문적인 용도를 위한 Dragon Professional, 그리고 내장 도구 이상을 원하는 Windows 사용자를 위한 최신 AI 기반 옵션입니다.
옵션 1: Windows 음성 입력 (내장)
Windows 음성 입력은 Windows에서 음성 입력을 시작하는 가장 빠른 경로입니다. 설치가 필요 없으며 Windows 10 버전 20H2 이상과 Windows 11에서 사용할 수 있습니다.
설정 방법
- 활성 텍스트 필드가 있는 어떤 애플리케이션에서든 Win + H를 누릅니다
- 화면 상단에 마이크 위젯이 나타납니다
- 마이크 버튼을 클릭하거나 Win+H를 다시 누릅니다
- 말하기 시작합니다
이것으로 끝입니다. 설치, 계정, 기본 사용을 위한 설정이 전혀 필요 없습니다.
자동 구두점 활성화
자동 구두점(Windows 11 및 최근 Windows 10 빌드)은 명시적으로 말하지 않아도 쉼표와 마침표를 자동으로 추가합니다.
- Win+H를 눌러 음성 입력을 엽니다
- 위젯의 기어 아이콘을 클릭합니다
- "자동 구두점"을 활성화합니다
언어 설정
시스템 기본값 이외의 언어로 받아쓰려면 다음과 같이 합니다.
- 설정 > 시간 및 언어 > 언어 및 지역으로 이동합니다
- 원하는 언어 팩을 추가합니다
- 해당 언어의 음성 인식 패키지를 다운로드합니다
- 받아쓰기 전에 작업 표시줄 언어 선택기에서 입력 언어를 전환합니다
2026년 기준 Windows 음성 입력 지원 언어: 영어(미국, 영국, 호주, 인도), 중국어(간체, 번체), 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 일본어, 한국어, 아랍어 및 약 15개 언어 추가. 전체 목록은 Microsoft 공식 문서에서 확인할 수 있습니다.
음성 명령
Windows 음성 입력은 여러 음성 명령을 지원합니다.
- "Stop listening" — 마이크를 비활성화합니다
- "Delete that" — 마지막으로 받아쓴 텍스트를 제거합니다
- "Scratch that" — 마지막 발화를 제거합니다
- "Go to sleep" / "Wake up" — 청취 상태를 전환합니다
한계
Windows 음성 입력은 원본 전사를 생성합니다. AI 강화, 이메일 서식, 구조화된 출력이 없습니다. 군더더기 단어가 텍스트에 그대로 나타납니다. 자동 구두점이 활성화된 경우 구두점이 처리되지만 복잡한 문장 구조는 수동 정리가 필요할 수 있습니다.
편집을 예상하는 일상적인 받아쓰기에는 잘 작동합니다. 편집 없이 전문적인 품질의 텍스트가 필요한 경우에는 적합하지 않습니다.
옵션 2: Dragon Professional (Windows)
Dragon Professional은 법률, 의료, 금융, 기술 분야처럼 도메인별 어휘가 필요한 전문 수준의 정확도를 원하는 Windows 사용자를 위한 선택입니다.
설치
- Nuance 웹사이트에서 Dragon Professional을 구매합니다(2026년 기준 $699)
- 설치 프로그램을 다운로드합니다
- 설정 마법사를 실행합니다
- 음성 프로필을 생성합니다(초기 훈련은 5~10분 소요)
음성 프로필 훈련
Dragon의 음성 훈련은 정확도를 크게 향상시킵니다. 설정 중에:
- 제공된 텍스트 구절을 읽습니다(약 2~3분 분량)
- Dragon이 음성 패턴, 억양, 발화 스타일을 분석합니다
- 프로필이 사용자 계정에 저장됩니다
정확도는 시간이 지남에 따라 사용자가 수정한 내용을 Dragon이 학습하면서 더욱 향상됩니다.
커스텀 어휘
커스텀 어휘 기능은 전문 사용에서 Dragon의 가장 강력한 장점입니다.
- Dragon의 어휘 편집기를 엽니다
- 도메인별 용어(의학 용어, 법적 인용, 제품 이름, 기술 용어)를 추가합니다
- 약어에 대해 문어 형태와 구어 형태를 추가합니다(구어: "그 회사", 문어: "Acme Corporation")
전문화된 어휘가 필요한 전문가에게는 이 기능만으로도 비용이 정당화됩니다.
Dragon 기본 사용법
Dragon에서 푸시 투 토크에 해당하는 방법: 사용자 정의 가능한 키를 누르고 놓아(기본값은 숫자 패드의 빼기 키) 청취를 시작합니다. "stop listening"이라고 말하거나 키를 다시 누르면 중지됩니다.
Dragon은 애플리케이션 제어 명령도 지원합니다 — 음성으로 애플리케이션 전환, 버튼 클릭, 메뉴 탐색, Windows 기능 제어를 할 수 있습니다. 거동 장애가 있는 사용자에게 유용합니다.
옵션 3: Windows용 최신 AI 음성 인식
2026년 Windows 시장의 공백은 Whisper 수준의 전사 정확도와 AI 텍스트 강화를 시스템 전체 푸시 투 토크 인터페이스에 결합한 도구가 없다는 것입니다. macOS에는 그런 조합을 갖춘 도구(Telvr, Wispr Flow)가 있지만 Windows에는 아직 없습니다.
Windows 사용자가 현재 사용할 수 있는 것
Whisper Desktop (오픈소스): 여러 커뮤니티 도구가 Whisper를 Windows에서 사용할 수 있게 합니다. 가장 잘 유지 관리되는 것들은 다음과 같습니다.
- Whispering (오픈소스, GitHub) — 오디오를 녹음하고 로컬 Whisper로 전사한 후 클립보드에 붙여넣기
- FasterWhisper on Windows — Python 설정 필요, 양자화 모델로 더 나은 성능
이들은 강화 없이 원본 Whisper 전사를 생성합니다. 설정에는 명령줄 도구에 대한 기술적 편안함이 필요합니다.
Voice In (Chrome 확장 프로그램): Chrome의 모든 텍스트 필드에 음성 입력을 추가하는 브라우저 확장 프로그램입니다. Whisper가 아닌 Google의 Web Speech API를 사용합니다. 영어 정확도는 우수하지만 다른 언어에는 제한적입니다. Chrome 내에서만 작동합니다.
Windows용 Telvr
Telvr의 Windows 버전은 개발 중입니다. 출시 시 Windows에 전체 Telvr 경험을 제공할 예정입니다. 푸시 투 토크, Whisper large-v3 전사, 6가지 AI 강화 모드, 시스템 전체 텍스트 삽입이 포함됩니다.
Windows 버전이 출시될 때 알림을 받으려면 Telvr 웹사이트에서 대기 목록에 등록하십시오.
마이크 설정 (모든 방법에 적용)
마이크 품질은 사용하는 음성 인식 도구보다 더 중요합니다. 좋지 않은 마이크는 기반 모델에 관계없이 정확도를 제한합니다.
노트북 내장 마이크
조용한 환경에서는 사용할 수 있습니다. 배경 소음, 공조 소음 또는 주변 사무실 소리와 함께 어려움을 겪을 수 있습니다.
외부 USB 마이크
상당한 업그레이드입니다. 입문 수준의 USB 마이크(5~10만원 수준, Blue Yeti Nano, Rode NT-USB Mini)는 내장 노트북 마이크보다 현저히 깨끗한 오디오를 제공합니다. 향상된 입력 품질은 직접적으로 더 나은 정확도로 이어집니다.
헤드셋 마이크
일관된 마이크 거리와 위치가 헤드셋을 받아쓰기에 특히 우수하게 만듭니다. USB 또는 블루투스 헤드셋 모두 사용 가능합니다. 가능하면 아날로그 3.5mm를 피하십시오. 노이즈가 발생하는 경향이 있습니다.
Windows에서 마이크 설정
- 설정 > 시스템 > 소리로 이동합니다
- 입력에서 원하는 마이크를 선택합니다
- "마이크 구성"을 클릭하고 보정 마법사를 따릅니다
- 볼륨 미터를 사용하여 일반 대화 볼륨으로 말할 때 입력 레벨이 적절한지 확인합니다
목표 입력 레벨: 일반 대화 볼륨으로 말할 때 볼륨 바가 최대치의 약 75%에 도달해야 합니다. 너무 조용하면 인식이 약화되고, 너무 크면 클리핑이 발생합니다.
일반적인 문제 해결
음성 입력이 활성화되지 않는 경우(Win+H):
- 텍스트 필드가 활성화되어 있는지 확인합니다(먼저 텍스트 상자를 클릭)
- 마이크 권한 확인: 설정 > 개인 정보 및 보안 > 마이크
어떤 도구에서도 정확도가 낮은 경우:
- 다른 마이크로 테스트합니다
- 더 조용한 환경으로 이동합니다
- 약간 더 천천히, 명확하게 말합니다
- Dragon의 경우: 여러 시간 사용 후 정확도 조정 마법사를 실행합니다
텍스트가 잘못된 위치에 나타나는 경우:
- 대상 애플리케이션이 해당 특정 필드에서 음성 입력을 지원하지 않을 수 있습니다
- 올바른 창과 텍스트 필드에 포커스가 있는지 확인합니다
높은 지연 시간(말하기와 텍스트 나타남 사이의 긴 대기):
- Windows 음성 입력은 Microsoft 서버에서 처리됩니다. 인터넷 연결을 확인합니다
- Dragon의 경우: 로컬 처리이므로 CPU 사용량을 확인합니다 — 다른 요구 사항이 높은 앱이 속도를 늦출 수 있습니다