Блог

Как использовать голосовой ввод в любом приложении Mac

Проблема совместимости приложений

Большинство инструментов голосового ввода на Mac работают только там, где разработчик добавил поддержку. Apple Dictation работает в приложениях Apple и большинстве текстовых полей, но ведёт себя непредсказуемо в сторонних приложениях. Веб-инструменты голосового ввода работают только в текстовых полях Chrome. Специализированные приложения диктовки нередко требуют диктовать в свой интерфейс, а потом вставлять результат вручную.

Чтобы привычка голосового ввода действительно прижилась, он должен работать везде — в терминале, в IDE, в десктопном Slack, в Notion, в форме, которую вы заполняете раз в год. Если перед каждым нажатием горячей клавиши нужно думать, поддерживает ли приложение голос, — это трение убивает привычку.

Системный ввод текста решает эту проблему, полностью обходя уровень приложения.

Как работает системный ввод

Стандартные инструменты голосового ввода взаимодействуют с приложениями через API доступности или приложение-специфичные интеграции. Именно поэтому они работают только в «поддерживаемых» приложениях — последнее должно реализовать конкретный интерфейс.

Системный ввод работает иначе. После транскрипции и обработки речи инструмент программно имитирует ввод с клавиатуры на уровне операционной системы — так же, как работают ремапперы клавиш или инструменты автоматизации. Результат появляется в позиции курсора, будто его набирали — символ за символом.

Поскольку это происходит на уровне ввода ОС, а не через API приложения, работает практически в любом приложении, принимающем текстовый ввод:

  • Текстовые редакторы и IDE
  • Терминал и командная строка
  • Текстовые поля браузера (включая веб-приложения)
  • Нативные приложения macOS
  • Electron-приложения (VS Code, Notion, Slack, Discord)
  • Поля форм в PDF, принимающих ввод
  • Поля паролей (с разумной осторожностью)

Настройка системного голосового ввода на Mac с Telvr

Шаг 1: Установите Telvr

Скачайте Telvr с сайта и установите. При первом запуске macOS запросит разрешение на доступность — именно оно обеспечивает системный ввод текста. Предоставьте его в «Системных настройках» → «Конфиденциальность и безопасность» → «Специальные возможности».

Без этого разрешения текст можно вставить только в приложениях, явно поддерживающих инструмент. С ним — вставка работает везде.

Шаг 2: Настройте горячую клавишу

По умолчанию в Telvr установлена комбинация Option + Пробел. Удобная и редко конфликтует с горячими клавишами приложений.

Если нужна другая комбинация:

  1. Откройте Telvr из строки меню
  2. Перейдите в «Настройки»
  3. Нажмите поле горячей клавиши и введите нужную комбинацию

Хорошие альтернативы:

  • Right Option + Пробел (если левый Option используется для других целей)
  • Control + Shift + Пробел
  • Программируемая клавиша функций, если клавиатура поддерживает
  • Дополнительная кнопка мыши

Избегайте:

  • Command + Пробел (Spotlight)
  • Option + Tab (переключатель окон в ряде приложений)
  • Любых сочетаний, активно используемых в вашей IDE

Шаг 3: Выберите режим обогащения

Перед диктовкой выберите режим, соответствующий контексту. Селектор режима — в иконке Telvr в строке меню.

Для использования в разных приложениях режим «Чистка» работает везде по умолчанию. Переключайтесь на другие режимы при необходимости специального форматирования.

Шаг 4: Поставьте курсор

Кликните в текстовое поле, документ, строку ввода терминала или любую редактируемую область, куда должен попасть текст. Курсор должен быть активен — Telvr вставляет текст именно в его позицию.

Шаг 5: Диктуйте

Удержите горячую клавишу, говорите естественно, отпустите. В течение 1–2 секунд отформатированный текст появится в позиции курсора.

Советы по конкретным приложениям

Терминал

Голосовой ввод в терминале удобен для длинных команд, сообщений git commit и любого ввода расширенного текста в строку команд.

Замечание: Текст появляется посимвольно в строке ввода. Стандартные команды работают нормально. Избегайте диктовки паролей — используйте менеджер паролей.

Особенно полезно для: git commit -m "..." (надиктуйте сообщение коммита), написания shell-скриптов в nano или vim (в режиме вставки), составления многострочного heredoc-контента.

VS Code

Все текстовые поля принимают диктовку: редактор, встроенный терминал, поля поиска и замены, поле сообщения коммита и поле комментария в панели Source Control.

Рекомендуемый режим: «Чистка» для комментариев к коду, «Задача разработчика» для описаний пулл-реквестов и сообщений коммитов.

Браузер (Safari, Chrome, Firefox)

Любой элемент input, textarea или contenteditable принимает диктовку. Это охватывает веб-почту, Google Docs, Notion в браузере, формы GitHub Issues и практически любое веб-приложение.

Slack (десктопное приложение)

Electron-приложения вроде Slack принимают системный ввод. Диктуйте прямо в поле составления сообщения. Режим «Чистка» хорошо подходит для сообщений; режим «Заметки о встрече» — для кратких итогов в тредах Slack.

Notion

Работает и десктопное приложение, и браузерная версия. Диктовка прямо в страницы Notion в режиме «Чистка» или «Заметки о встрече» даёт хорошо отформатированный контент.

Почта и Календарь

Нативные приложения macOS полностью поддерживаются. Окна составления писем, описания событий календаря и поля заметок — всё принимает диктовку.

Решение типичных проблем

Текст не появляется:

  • Убедитесь, что разрешение на доступность предоставлено в «Системных настройках»
  • Убедитесь, что курсор стоит в редактируемом поле, а не в области только для чтения
  • Некоторые защищённые поля (например, в менеджерах паролей) намеренно блокируют программный ввод

Текст появляется не там:

  • Точка вставки сместилась между нажатием горячей клавиши и появлением текста. Сохраняйте фокус на целевом окне во время диктовки.

Лишние символы или искажённый вывод:

  • Иногда возникает в приложениях с автодополнением, которое неправильно интерпретирует быстрый ввод символов. Отключите автодополнение в этом приложении.

Работает в одних приложениях, но не в других:

  • Некоторые защищённые или sandbox-приложения ограничивают программный ввод. Это политика безопасности конкретного приложения, а не ограничение Telvr.

Почему системная диктовка работает иначе

Практическая разница между системной диктовкой и приложение-специфичными голосовыми инструментами — в ментальной модели.

При приложение-специфичных инструментах голосовой ввод — это функция определённых приложений. Вы помните, в каких работает, и адаптируете своё поведение соответственно.

При системной диктовке голосовой ввод — это поведение, доступное везде. Горячая клавиша всегда работает. Привычка становится рефлекторной, а не требующей сознательного решения — к горячей клавише тянешься так же, как к любому другому клавиатурному сочетанию.

Именно эта универсальность делает голосовой ввод устойчивым инструментом продуктивности, а не разовым экспериментом.