Голосовой ввод на macOS в 2026 году
macOS всегда имел прочную основу для голосового ввода. Apple представил серверную диктовку ещё в OS X Mountain Lion, а тесная интеграция аппаратного и программного обеспечения позволяет даже сторонним инструментам глубоко встраиваться в систему. В 2026 году пользователи Mac имеют больше вариантов голосового ввода, чем когда-либо — включая инструменты, которые пять лет назад казались бы фантастикой.
Сложность — разобраться, какой вариант реально подходит именно вашему рабочему процессу. В этом сравнении — честная оценка каждого варианта: в чём он силён и где не дотягивает.
Apple Dictation (встроенная)
Apple Dictation — первое, что стоит рассмотреть: бесплатно и не требует установки. Включается в «Системных настройках» → «Клавиатура», где можно назначить горячую клавишу (по умолчанию — двойное нажатие Fn или клавиша диктовки).
Как работает: Короткие фразы обрабатываются на устройстве с помощью голосовой модели Apple. Для длинных сессий диктовки можно дополнительно использовать серверы Apple. Текст появляется в активном текстовом поле в реальном времени.
Точность: Уверенная для распространённого английского языка. Хорошо справляется с разговорной речью. Затрудняется с технической терминологией, именами собственными, которых нет в словаре Apple, и смежной с кодом лексикой.
Форматирование: Только базовая пунктуация при явных командах. Нет AI-обогащения. Если скажете «эм» или «как», эти слова появятся в тексте.
Конфиденциальность: Обработка коротких фраз на устройстве действительно приватна. При серверной обработке аудио отправляется в Apple.
Лучше всего подходит для: Случайной диктовки в повседневных приложениях, пользователей, которым не нужна установка ничего лишнего, быстрого голосового ввода без требований к форматированию.
Telvr
Telvr — специализированное приложение «нажми-и-говори» для macOS. Устанавливается как приложение в строке меню и обеспечивает системный голосовой ввод с AI-обогащением.
Как работает: Удерживайте настраиваемую горячую клавишу в любом месте на Mac — в любом приложении, любом текстовом поле, даже в терминале. Произнесите текст, отпустите клавишу — и примерно через две секунды обработанный текст появится именно там, где стоит курсор.
Пайплайн обработки использует Whisper large-v3 через API вывода Groq для транскрипции, после которой следует этап AI-обогащения, превращающий сырую речь в отформатированный результат.
Шесть режимов обогащения:
- Сырая транскрипция — точный вывод речи, минимальная обработка
- Чистка и коррекция — убирает слова-паразиты, исправляет грамматику, добавляет знаки препинания
- Профессиональное письмо — форматирует речь как полноценное письмо с темой и приветствием
- Заметки о встрече — структурирует содержимое в пункты с решениями и задачами
- Краткое резюме (2–3 предложения) — сжимает длинную речь в компактное резюме
- Задача разработчика — структурирует задачу разработки с контекстом и критериями приёмки
Точность: Whisper large-v3 — одна из самых точных моделей. В сочетании со слоем обогащения, исправляющим грамматику и убирающим слова-паразиты, качество результата стабильно выше, чем у инструментов сырой транскрипции.
Задержка: Менее 2 секунд для типичных фрагментов. Облачная обработка через оптимизированный инференс Groq настолько быстра, что задержка воспринимается как «инструмент думает», а не буферизует.
Поддержка языков: 50+ языков с автоматическим определением. Указывать язык вручную не нужно — Telvr определяет его по речи.
Тарификация: EUR 3 в месяц ежемесячного минимума (засчитывается в счёт использования) плюс от EUR 0,003 за минуту диктовки. 14-дневный пробный период включает EUR 3 стартового кредита.
Лучше всего подходит для: Специалистов, которым нужен системный голосовой ввод с чистым отформатированным результатом без ручного редактирования.
Wispr Flow
Wispr Flow — ближайший конкурент Telvr на macOS. Тот же подход «нажми-и-говори» плюс AI-обработка для получения чистого результата.
Сильные стороны: Отполированный интерфейс, высокое качество AI-вывода и режим «flow», который более изящно работает с длинными сессиями диктовки с естественными паузами.
Тарификация: $14 в месяц, фиксированная ставка. Выгоднее при интенсивном использовании (30+ минут в день) и менее выгодно при умеренном по сравнению с объёмной моделью Telvr.
Ограничения: Нет режима пользовательского промпта. Поддержка языков уже, чем у инструментов на базе Whisper.
Лучше всего подходит для: Пользователей Mac, которые диктуют много ежедневно и предпочитают фиксированную ежемесячную стоимость.
Whisper (самостоятельная установка)
Модель OpenAI Whisper доступна как проект с открытым кодом. С помощью нужных инструментов её можно запустить локально на Mac с Apple Silicon.
Как работает: Вы записываете аудио (например, через sox или обёртку вроде whisper-mic), прогоняете через локальную модель Whisper и получаете транскрипцию. Облачный API не нужен.
Точность: Идентична транскрипционному качеству Telvr — та же модель Whisper large-v3. Разница — только в пайплайне и слое обогащения.
Задержка: На Apple Silicon (M2/M3/M4) Whisper large-v3 работает 3–8 секунд локально. Меньшие модели (medium, small) — 1–3 секунды с некоторым снижением точности.
Интеграция: Никакой из коробки. Нужно построить собственный пайплайн для вставки текста в активное приложение. Существуют сообщественные проекты (Whispering, MacWhisper и др.), но они требуют настройки.
Обогащение: Нулевое. Вы получаете только сырую транскрипцию. Постобработка требует дополнительных инструментов.
Конфиденциальность: Полностью локально. Никакое аудио не покидает ваш компьютер.
Лучше всего подходит для: Разработчиков, которым нужен полный контроль, пользователей с повышенными требованиями к приватности, тех, кто строит собственные рабочие процессы.
Dragon для Mac (прекращён)
Dragon NaturallySpeaking для Mac был прекращён компанией Nuance в 2023 году. Актуальная версия для macOS недоступна. Если вы ищете точность уровня Dragon и управление словарём на Mac, вашими вариантами являются Telvr, Wispr Flow или локальный Whisper.
Это стоит упомянуть, поскольку многие результаты поиска по-прежнему ссылаются на Dragon для Mac — этот вариант больше не актуален.
Таблица сравнения
| Функция | Apple Dictation | Telvr | Wispr Flow | Whisper (локально) | |---|---|---|---|---| | Системный ввод | Да | Да | Да | С настройкой | | AI-обогащение | Нет | Да (6 режимов) | Да | Нет | | Задержка | 1–3 с | Менее 2 с | Менее 2 с | 3–8 с | | Поддержка языков | ~60 | 50+ (автоопределение) | ~40 | 99 | | Конфиденциальность | На устройстве (опция) | Облако | Облако | Полностью локально | | Цена | Бесплатно | EUR 3/мес + использование | $14/мес | Бесплатно | | Пользовательский промпт | Нет | Да | Нет | Нет |
Наша рекомендация
Для большинства пользователей Mac, которые хотят использовать голосовой ввод как реальный инструмент продуктивности, а не для случайной диктовки, — Telvr является наиболее комплексным решением. Сочетание системного ввода, быстрой облачной обработки и режимов AI-обогащения устраняет две причины, по которым голосовой ввод обычно не работает как инструмент рабочего процесса: нужно переключать приложения и результат требует серьёзного редактирования.
Выберите Apple Dictation, если вам нужен только случайный голосовой ввод в стандартных приложениях без установки чего-либо дополнительного.
Выберите Wispr Flow, если вы диктуете много каждый день и предпочитаете фиксированную ежемесячную плату.
Выберите локальный Whisper, если приватность — непременное требование и вы готовы построить собственный пайплайн.
Ключевое понимание: в 2026 году сырая точность, при всей её важности, — уже не главный отличительный фактор. Whisper large-v3, доступный через несколько продуктов, чрезвычайно точен. Отличие — в том, что происходит с текстом после транскрипции: вы получаете сырой вывод речи или отформатированный, готовый к использованию текст.