블로그

Mac의 모든 앱에서 음성 텍스트 변환 사용하기

앱 호환성 문제

Mac에서 대부분의 음성 입력 도구는 개발자가 지원을 추가하기로 생각한 곳에서만 작동합니다. Apple Dictation은 Apple 자체 앱과 대부분의 텍스트 필드에서 작동하지만 서드파티 애플리케이션에서는 일관성 없이 동작합니다. 웹 기반 음성 도구는 Chrome 텍스트 필드에서만 작동합니다. 전용 받아쓰기 앱은 종종 자체 인터페이스에서 받아쓰기를 하고 결과를 붙여넣기를 요구합니다.

음성 입력 습관이 실제로 유지되려면 어디서나 작동해야 합니다 — 터미널에서, IDE에서, Slack 데스크톱 앱에서, Notion에서, 일 년에 두 번 작성하는 양식에서. 단축키를 누르기 전에 음성이 작동할지 생각해야 한다면 그 마찰이 습관을 무너뜨립니다.

시스템 전체 텍스트 삽입은 애플리케이션 레이어를 완전히 우회함으로써 이 문제를 해결합니다.

시스템 전체 삽입의 원리

표준 음성 입력 도구는 접근성 API나 앱별 통합을 통해 애플리케이션과 통신합니다. 이것이 "지원되는" 앱에서만 작동하는 이유입니다 — 앱이 음성 도구가 사용하는 특정 인터페이스를 구현하거나 지원해야 합니다.

시스템 전체 삽입은 다르게 작동합니다. 음성을 전사하고 처리한 후, 도구는 운영 체제 수준에서 프로그래밍 방식으로 키보드 입력을 시뮬레이션합니다 — 키보드 리매퍼나 매크로 도구 같은 접근성 소프트웨어가 작동하는 것과 같은 방식입니다. 결과는 마치 한 글자씩 타이핑한 것처럼 커서 위치에 나타납니다.

이것이 앱 API가 아닌 OS 입력 수준에서 작동하기 때문에 텍스트 입력을 허용하는 거의 모든 애플리케이션에서 작동합니다.

  • 텍스트 에디터와 IDE
  • 터미널과 명령줄
  • 브라우저 텍스트 필드(웹 앱 포함)
  • 네이티브 macOS 앱
  • Electron 앱(VS Code, Notion, Slack, Discord)
  • 입력을 허용하는 PDF 양식 필드
  • 비밀번호 필드(적절한 주의를 기울여서)

Telvr로 Mac 시스템 전체 음성 입력 설정하기

1단계: Telvr 설치

웹사이트에서 Telvr를 다운로드하고 설치합니다. 첫 번째 실행 시 macOS가 손쉬운 사용 권한을 요청합니다 — 이것이 시스템 전체 텍스트 삽입을 가능하게 하는 권한입니다. 시스템 설정의 개인 정보 보호 및 보안 > 손쉬운 사용에서 권한을 부여합니다.

이 권한 없이는 도구를 명시적으로 지원하는 앱에서만 텍스트를 삽입할 수 있습니다. 이 권한을 부여하면 어디서나 텍스트 삽입이 작동합니다.

2단계: 단축키 설정

Telvr는 기본적으로 Option + Space를 사용합니다. 이 조합은 편안하고(각 키에 엄지) 애플리케이션 단축키와 거의 충돌하지 않습니다.

다른 키 조합을 선호한다면 다음과 같이 합니다.

  1. 메뉴 바에서 Telvr를 엽니다
  2. 환경설정으로 이동합니다
  3. 단축키 필드를 클릭하고 원하는 조합을 누릅니다

좋은 대안:

  • 오른쪽 Option + Space(왼쪽 Option을 타이핑에 사용하는 경우)
  • Control + Shift + Space
  • 프로그래밍 가능한 키보드의 전용 기능 키
  • 마우스에 추가 버튼이 있는 경우 사이드 버튼

피해야 할 것:

  • Command + Space(Spotlight)
  • Option + Tab(일부 앱의 창 전환기)
  • IDE에서 자주 사용하는 조합

3단계: 강화 모드 선택

받아쓰기 전에 맥락에 맞는 모드를 선택합니다. 모드 선택기는 Telvr 메뉴 바 아이콘에 있습니다.

다양한 앱에서 시스템 전체 사용에는 정리 모드가 어디서나 작동하는 기본 설정입니다. 군더더기를 제거하고, 문법을 교정하고, 구두점을 추가합니다. 특정 맥락에 따라 다른 모드로 전환합니다.

4단계: 커서 위치 지정

텍스트 필드, 문서, 터미널 프롬프트, 또는 텍스트가 나타나기를 원하는 편집 가능한 영역을 클릭합니다. 커서가 배치되어 있어야 합니다 — Telvr는 커서 위치에 텍스트를 삽입하므로 활성 커서가 없으면 아무것도 나타나지 않습니다.

5단계: 받아쓰기

단축키를 유지하고, 자연스럽게 말하고, 놓습니다. 1~2초 이내에 서식이 갖춰진 텍스트가 커서 위치에 나타납니다.

앱별 팁

터미널

터미널에서 음성 입력은 긴 명령어, git 커밋 메시지, 확장된 텍스트 입력을 허용하는 모든 터미널 프롬프트에 유용합니다.

참고: 텍스트가 터미널 프롬프트에서 한 글자씩 나타납니다. 표준 명령어는 잘 작동합니다. 비밀번호를 직접 받아쓰지 마십시오 — 비밀번호 관리자를 사용하십시오.

특히 유용한 경우: git commit -m "..." (커밋 메시지를 말합니다), nano나 vim에서 셸 스크립트 작성(삽입 모드에서), 여러 줄의 heredoc 내용 작성.

VS Code

모든 텍스트 필드에서 받아쓰기가 가능합니다. 에디터 자체, 통합 터미널, 검색 및 교체 필드, git 커밋 메시지 필드, 소스 제어 패널의 주석 필드가 모두 해당됩니다.

권장 모드: 코드 주석은 정리 모드, 풀 리퀘스트 설명과 커밋 메시지는 개발 작업 모드.

브라우저 (Safari, Chrome, Firefox)

모든 input, textarea, contenteditable 요소에서 받아쓰기가 가능합니다. 웹 기반 이메일 클라이언트, Google Docs, 브라우저의 Notion, GitHub 이슈 양식, 사실상 모든 웹 애플리케이션이 포함됩니다.

Slack 데스크톱 앱

Slack 같은 Electron 기반 앱은 시스템 전체 삽입을 허용합니다. 메시지 작성 필드에 바로 받아쓸 수 있습니다. 메시지에는 정리 모드가 잘 작동하고, Slack 스레드에 회의 후 요약을 작성할 때는 회의록 모드가 유용합니다.

Notion

데스크톱 앱과 브라우저 버전 모두 작동합니다. 정리 모드나 회의록 모드로 Notion 페이지에 바로 받아쓰면 서식이 잘 갖춰진 내용을 작성할 수 있습니다.

Mail 및 Calendar

네이티브 macOS 앱은 완전히 지원됩니다. 이메일 작성 창, 캘린더 이벤트 설명, 메모 필드가 모두 받아쓰기를 허용합니다.

문제 해결

텍스트가 나타나지 않는 경우:

  • 시스템 설정에서 손쉬운 사용 권한이 부여되었는지 확인합니다
  • 커서가 편집 가능한 필드에 위치해 있는지 확인합니다(읽기 전용 영역이 아닌지)
  • 특정 보안 강화된 텍스트 필드(일부 비밀번호 관리자 등)는 의도적으로 프로그래밍 방식 입력을 차단합니다

텍스트가 잘못된 위치에 나타나는 경우:

  • 단축키를 누른 후 텍스트가 나타나기 전에 삽입 지점이 이동했습니다. 받아쓰기 중에 목적지 창에 포커스를 유지하십시오.

추가 문자가 나타나거나 출력이 이상한 경우:

  • 빠른 문자 입력을 잘못 해석하는 자동 완성 기능이 있는 앱에서 가끔 발생합니다. 해당 앱에서 자동 완성을 비활성화하거나 설정에서 조정합니다.

일부 앱에서는 작동하지만 다른 앱에서는 작동하지 않는 경우:

  • 일부 샌드박스 또는 보안이 강화된 앱은 프로그래밍 방식 입력을 제한합니다. 이는 앱의 보안 정책이며, Telvr의 한계가 아닙니다.

시스템 전체 받아쓰기가 만드는 차이

시스템 전체 받아쓰기와 앱별 음성 도구의 실질적인 차이는 정신적 모델에 있습니다.

앱별 도구를 사용하면 음성 입력은 특정 앱의 기능입니다. 어떤 앱이 지원하는지 기억하고 그에 맞게 행동을 바꿉니다.

시스템 전체 받아쓰기를 사용하면 음성 입력은 어디서나 사용 가능한 동작입니다. 단축키는 항상 거기 있습니다. 습관이 의도적이 아니라 반사적으로 됩니다 — 키보드 단축키에 손을 뻗는 것과 같은 방식으로 단축키에 손을 뻗습니다.

그 일관성이 음성 입력을 일회성 실험이 아닌 지속 가능한 생산성 도구로 만드는 것입니다.