Блог

Распознавание речи для Mac: полное сравнение (2026)

Голосовой ввод на macOS в 2026 году

macOS всегда имел прочную основу для голосового ввода. Apple представил серверную диктовку ещё в OS X Mountain Lion, а тесная интеграция аппаратного и программного обеспечения позволяет даже сторонним инструментам глубоко встраиваться в систему. В 2026 году пользователи Mac имеют больше вариантов голосового ввода, чем когда-либо — включая инструменты, которые пять лет назад казались бы фантастикой.

Сложность — разобраться, какой вариант реально подходит именно вашему рабочему процессу. В этом сравнении — честная оценка каждого варианта: в чём он силён и где не дотягивает.

Apple Dictation (встроенная)

Apple Dictation — первое, что стоит рассмотреть: бесплатно и не требует установки. Включается в «Системных настройках» → «Клавиатура», где можно назначить горячую клавишу (по умолчанию — двойное нажатие Fn или клавиша диктовки).

Как работает: Короткие фразы обрабатываются на устройстве с помощью голосовой модели Apple. Для длинных сессий диктовки можно дополнительно использовать серверы Apple. Текст появляется в активном текстовом поле в реальном времени.

Точность: Уверенная для распространённого английского языка. Хорошо справляется с разговорной речью. Затрудняется с технической терминологией, именами собственными, которых нет в словаре Apple, и смежной с кодом лексикой.

Форматирование: Только базовая пунктуация при явных командах. Нет AI-обогащения. Если скажете «эм» или «как», эти слова появятся в тексте.

Конфиденциальность: Обработка коротких фраз на устройстве действительно приватна. При серверной обработке аудио отправляется в Apple.

Лучше всего подходит для: Случайной диктовки в повседневных приложениях, пользователей, которым не нужна установка ничего лишнего, быстрого голосового ввода без требований к форматированию.

Telvr

Telvr — специализированное приложение «нажми-и-говори» для macOS. Устанавливается как приложение в строке меню и обеспечивает системный голосовой ввод с AI-обогащением.

Как работает: Удерживайте настраиваемую горячую клавишу в любом месте на Mac — в любом приложении, любом текстовом поле, даже в терминале. Произнесите текст, отпустите клавишу — и примерно через две секунды обработанный текст появится именно там, где стоит курсор.

Пайплайн обработки использует Whisper large-v3 через API вывода Groq для транскрипции, после которой следует этап AI-обогащения, превращающий сырую речь в отформатированный результат.

Шесть режимов обогащения:

  • Сырая транскрипция — точный вывод речи, минимальная обработка
  • Чистка и коррекция — убирает слова-паразиты, исправляет грамматику, добавляет знаки препинания
  • Профессиональное письмо — форматирует речь как полноценное письмо с темой и приветствием
  • Заметки о встрече — структурирует содержимое в пункты с решениями и задачами
  • Краткое резюме (2–3 предложения) — сжимает длинную речь в компактное резюме
  • Задача разработчика — структурирует задачу разработки с контекстом и критериями приёмки

Точность: Whisper large-v3 — одна из самых точных моделей. В сочетании со слоем обогащения, исправляющим грамматику и убирающим слова-паразиты, качество результата стабильно выше, чем у инструментов сырой транскрипции.

Задержка: Менее 2 секунд для типичных фрагментов. Облачная обработка через оптимизированный инференс Groq настолько быстра, что задержка воспринимается как «инструмент думает», а не буферизует.

Поддержка языков: 50+ языков с автоматическим определением. Указывать язык вручную не нужно — Telvr определяет его по речи.

Тарификация: EUR 3 в месяц ежемесячного минимума (засчитывается в счёт использования) плюс от EUR 0,003 за минуту диктовки. 14-дневный пробный период включает EUR 3 стартового кредита.

Лучше всего подходит для: Специалистов, которым нужен системный голосовой ввод с чистым отформатированным результатом без ручного редактирования.

Wispr Flow

Wispr Flow — ближайший конкурент Telvr на macOS. Тот же подход «нажми-и-говори» плюс AI-обработка для получения чистого результата.

Сильные стороны: Отполированный интерфейс, высокое качество AI-вывода и режим «flow», который более изящно работает с длинными сессиями диктовки с естественными паузами.

Тарификация: $14 в месяц, фиксированная ставка. Выгоднее при интенсивном использовании (30+ минут в день) и менее выгодно при умеренном по сравнению с объёмной моделью Telvr.

Ограничения: Нет режима пользовательского промпта. Поддержка языков уже, чем у инструментов на базе Whisper.

Лучше всего подходит для: Пользователей Mac, которые диктуют много ежедневно и предпочитают фиксированную ежемесячную стоимость.

Whisper (самостоятельная установка)

Модель OpenAI Whisper доступна как проект с открытым кодом. С помощью нужных инструментов её можно запустить локально на Mac с Apple Silicon.

Как работает: Вы записываете аудио (например, через sox или обёртку вроде whisper-mic), прогоняете через локальную модель Whisper и получаете транскрипцию. Облачный API не нужен.

Точность: Идентична транскрипционному качеству Telvr — та же модель Whisper large-v3. Разница — только в пайплайне и слое обогащения.

Задержка: На Apple Silicon (M2/M3/M4) Whisper large-v3 работает 3–8 секунд локально. Меньшие модели (medium, small) — 1–3 секунды с некоторым снижением точности.

Интеграция: Никакой из коробки. Нужно построить собственный пайплайн для вставки текста в активное приложение. Существуют сообщественные проекты (Whispering, MacWhisper и др.), но они требуют настройки.

Обогащение: Нулевое. Вы получаете только сырую транскрипцию. Постобработка требует дополнительных инструментов.

Конфиденциальность: Полностью локально. Никакое аудио не покидает ваш компьютер.

Лучше всего подходит для: Разработчиков, которым нужен полный контроль, пользователей с повышенными требованиями к приватности, тех, кто строит собственные рабочие процессы.

Dragon для Mac (прекращён)

Dragon NaturallySpeaking для Mac был прекращён компанией Nuance в 2023 году. Актуальная версия для macOS недоступна. Если вы ищете точность уровня Dragon и управление словарём на Mac, вашими вариантами являются Telvr, Wispr Flow или локальный Whisper.

Это стоит упомянуть, поскольку многие результаты поиска по-прежнему ссылаются на Dragon для Mac — этот вариант больше не актуален.

Таблица сравнения

| Функция | Apple Dictation | Telvr | Wispr Flow | Whisper (локально) | |---|---|---|---|---| | Системный ввод | Да | Да | Да | С настройкой | | AI-обогащение | Нет | Да (6 режимов) | Да | Нет | | Задержка | 1–3 с | Менее 2 с | Менее 2 с | 3–8 с | | Поддержка языков | ~60 | 50+ (автоопределение) | ~40 | 99 | | Конфиденциальность | На устройстве (опция) | Облако | Облако | Полностью локально | | Цена | Бесплатно | EUR 3/мес + использование | $14/мес | Бесплатно | | Пользовательский промпт | Нет | Да | Нет | Нет |

Наша рекомендация

Для большинства пользователей Mac, которые хотят использовать голосовой ввод как реальный инструмент продуктивности, а не для случайной диктовки, — Telvr является наиболее комплексным решением. Сочетание системного ввода, быстрой облачной обработки и режимов AI-обогащения устраняет две причины, по которым голосовой ввод обычно не работает как инструмент рабочего процесса: нужно переключать приложения и результат требует серьёзного редактирования.

Выберите Apple Dictation, если вам нужен только случайный голосовой ввод в стандартных приложениях без установки чего-либо дополнительного.

Выберите Wispr Flow, если вы диктуете много каждый день и предпочитаете фиксированную ежемесячную плату.

Выберите локальный Whisper, если приватность — непременное требование и вы готовы построить собственный пайплайн.

Ключевое понимание: в 2026 году сырая точность, при всей её важности, — уже не главный отличительный фактор. Whisper large-v3, доступный через несколько продуктов, чрезвычайно точен. Отличие — в том, что происходит с текстом после транскрипции: вы получаете сырой вывод речи или отформатированный, готовый к использованию текст.