Проблема совместимости приложений
Большинство инструментов голосового ввода на Mac работают только там, где разработчик добавил поддержку. Apple Dictation работает в приложениях Apple и большинстве текстовых полей, но ведёт себя непредсказуемо в сторонних приложениях. Веб-инструменты голосового ввода работают только в текстовых полях Chrome. Специализированные приложения диктовки нередко требуют диктовать в свой интерфейс, а потом вставлять результат вручную.
Чтобы привычка голосового ввода действительно прижилась, он должен работать везде — в терминале, в IDE, в десктопном Slack, в Notion, в форме, которую вы заполняете раз в год. Если перед каждым нажатием горячей клавиши нужно думать, поддерживает ли приложение голос, — это трение убивает привычку.
Системный ввод текста решает эту проблему, полностью обходя уровень приложения.
Как работает системный ввод
Стандартные инструменты голосового ввода взаимодействуют с приложениями через API доступности или приложение-специфичные интеграции. Именно поэтому они работают только в «поддерживаемых» приложениях — последнее должно реализовать конкретный интерфейс.
Системный ввод работает иначе. После транскрипции и обработки речи инструмент программно имитирует ввод с клавиатуры на уровне операционной системы — так же, как работают ремапперы клавиш или инструменты автоматизации. Результат появляется в позиции курсора, будто его набирали — символ за символом.
Поскольку это происходит на уровне ввода ОС, а не через API приложения, работает практически в любом приложении, принимающем текстовый ввод:
- Текстовые редакторы и IDE
- Терминал и командная строка
- Текстовые поля браузера (включая веб-приложения)
- Нативные приложения macOS
- Electron-приложения (VS Code, Notion, Slack, Discord)
- Поля форм в PDF, принимающих ввод
- Поля паролей (с разумной осторожностью)
Настройка системного голосового ввода на Mac с Telvr
Шаг 1: Установите Telvr
Скачайте Telvr с сайта и установите. При первом запуске macOS запросит разрешение на доступность — именно оно обеспечивает системный ввод текста. Предоставьте его в «Системных настройках» → «Конфиденциальность и безопасность» → «Специальные возможности».
Без этого разрешения текст можно вставить только в приложениях, явно поддерживающих инструмент. С ним — вставка работает везде.
Шаг 2: Настройте горячую клавишу
По умолчанию в Telvr установлена комбинация Option + Пробел. Удобная и редко конфликтует с горячими клавишами приложений.
Если нужна другая комбинация:
- Откройте Telvr из строки меню
- Перейдите в «Настройки»
- Нажмите поле горячей клавиши и введите нужную комбинацию
Хорошие альтернативы:
- Right Option + Пробел (если левый Option используется для других целей)
- Control + Shift + Пробел
- Программируемая клавиша функций, если клавиатура поддерживает
- Дополнительная кнопка мыши
Избегайте:
- Command + Пробел (Spotlight)
- Option + Tab (переключатель окон в ряде приложений)
- Любых сочетаний, активно используемых в вашей IDE
Шаг 3: Выберите режим обогащения
Перед диктовкой выберите режим, соответствующий контексту. Селектор режима — в иконке Telvr в строке меню.
Для использования в разных приложениях режим «Чистка» работает везде по умолчанию. Переключайтесь на другие режимы при необходимости специального форматирования.
Шаг 4: Поставьте курсор
Кликните в текстовое поле, документ, строку ввода терминала или любую редактируемую область, куда должен попасть текст. Курсор должен быть активен — Telvr вставляет текст именно в его позицию.
Шаг 5: Диктуйте
Удержите горячую клавишу, говорите естественно, отпустите. В течение 1–2 секунд отформатированный текст появится в позиции курсора.
Советы по конкретным приложениям
Терминал
Голосовой ввод в терминале удобен для длинных команд, сообщений git commit и любого ввода расширенного текста в строку команд.
Замечание: Текст появляется посимвольно в строке ввода. Стандартные команды работают нормально. Избегайте диктовки паролей — используйте менеджер паролей.
Особенно полезно для: git commit -m "..." (надиктуйте сообщение коммита), написания shell-скриптов в nano или vim (в режиме вставки), составления многострочного heredoc-контента.
VS Code
Все текстовые поля принимают диктовку: редактор, встроенный терминал, поля поиска и замены, поле сообщения коммита и поле комментария в панели Source Control.
Рекомендуемый режим: «Чистка» для комментариев к коду, «Задача разработчика» для описаний пулл-реквестов и сообщений коммитов.
Браузер (Safari, Chrome, Firefox)
Любой элемент input, textarea или contenteditable принимает диктовку. Это охватывает веб-почту, Google Docs, Notion в браузере, формы GitHub Issues и практически любое веб-приложение.
Slack (десктопное приложение)
Electron-приложения вроде Slack принимают системный ввод. Диктуйте прямо в поле составления сообщения. Режим «Чистка» хорошо подходит для сообщений; режим «Заметки о встрече» — для кратких итогов в тредах Slack.
Notion
Работает и десктопное приложение, и браузерная версия. Диктовка прямо в страницы Notion в режиме «Чистка» или «Заметки о встрече» даёт хорошо отформатированный контент.
Почта и Календарь
Нативные приложения macOS полностью поддерживаются. Окна составления писем, описания событий календаря и поля заметок — всё принимает диктовку.
Решение типичных проблем
Текст не появляется:
- Убедитесь, что разрешение на доступность предоставлено в «Системных настройках»
- Убедитесь, что курсор стоит в редактируемом поле, а не в области только для чтения
- Некоторые защищённые поля (например, в менеджерах паролей) намеренно блокируют программный ввод
Текст появляется не там:
- Точка вставки сместилась между нажатием горячей клавиши и появлением текста. Сохраняйте фокус на целевом окне во время диктовки.
Лишние символы или искажённый вывод:
- Иногда возникает в приложениях с автодополнением, которое неправильно интерпретирует быстрый ввод символов. Отключите автодополнение в этом приложении.
Работает в одних приложениях, но не в других:
- Некоторые защищённые или sandbox-приложения ограничивают программный ввод. Это политика безопасности конкретного приложения, а не ограничение Telvr.
Почему системная диктовка работает иначе
Практическая разница между системной диктовкой и приложение-специфичными голосовыми инструментами — в ментальной модели.
При приложение-специфичных инструментах голосовой ввод — это функция определённых приложений. Вы помните, в каких работает, и адаптируете своё поведение соответственно.
При системной диктовке голосовой ввод — это поведение, доступное везде. Горячая клавиша всегда работает. Привычка становится рефлекторной, а не требующей сознательного решения — к горячей клавише тянешься так же, как к любому другому клавиатурному сочетанию.
Именно эта универсальность делает голосовой ввод устойчивым инструментом продуктивности, а не разовым экспериментом.