Блог

Распознавание речи в Windows: полное руководство по настройке (2026)

Варианты голосового ввода в Windows

Windows предлагает больше вариантов распознавания речи, чем любая другая десктопная платформа — от полностью бесплатных встроенных инструментов до профессиональных корпоративных решений. Настройка нужного варианта займёт от двух минут до нескольких часов в зависимости от требований.

В этом руководстве рассматриваются три уровня: встроенный Windows Voice Typing, доступный сразу; Dragon Professional для специализированных профессиональных задач; и актуальное состояние современных AI-инструментов для тех пользователей Windows, кому встроенного решения недостаточно.

Вариант 1: Windows Voice Typing (встроенный)

Windows Voice Typing — самый быстрый путь к голосовому вводу в Windows. Не требует установки, доступен в Windows 10 версии 20H2 и новее, а также в Windows 11.

Настройка

  1. Нажмите Win + H в любом приложении с активным текстовым полем
  2. В верхней части экрана появится виджет с микрофоном
  3. Нажмите кнопку микрофона или снова нажмите Win+H
  4. Начните говорить

Всё. Никакой установки, никакой учётной записи, никакой настройки для базового использования.

Включение автоматической пунктуации

Автоматическая пунктуация (Windows 11 и свежие сборки Windows 10) расставляет запятые и точки автоматически — произносить их вслух не нужно.

  1. Нажмите Win+H, чтобы открыть Voice Typing
  2. Нажмите значок шестерёнки в виджете
  3. Включите «Auto-punctuation»

Настройка языка

Если вы хотите диктовать не на языке системы по умолчанию:

  1. Откройте «Параметры» → «Время и язык» → «Язык и регион»
  2. Добавьте нужный языковой пакет
  3. Загрузите пакет распознавания речи для этого языка
  4. Перед диктовкой переключите язык ввода через индикатор языка в панели задач

Поддерживаемые языки Windows Voice Typing (по состоянию на 2026): английский (США, Великобритания, Австралия, Индия), китайский (упрощённый и традиционный), французский, немецкий, испанский, итальянский, португальский, японский, корейский, арабский и около 15 других. Полный список — в официальной документации Microsoft.

Голосовые команды Voice Typing

Windows Voice Typing поддерживает несколько голосовых команд:

  • «Stop listening» — отключает микрофон
  • «Delete that» — удаляет последний надиктованный текст
  • «Scratch that» — удаляет последнее высказывание
  • «Go to sleep» / «Wake up» — переключает состояние прослушивания

Ограничения

Windows Voice Typing выдаёт сырую транскрипцию. Нет AI-обогащения, нет форматирования писем, нет структурированного вывода. Слова-паразиты попадают в текст. Автоматическая пунктуация работает при включении, но сложные конструкции могут потребовать ручной правки.

Инструмент хорошо подходит для повседневной диктовки, когда вы готовы к редактированию. Если нужен профессиональный текст без правок — это не тот инструмент.

Вариант 2: Dragon Professional (Windows)

Dragon Professional — выбор для пользователей Windows, которым нужна профессиональная точность со специализированным словарём — прежде всего в юриспруденции, медицине, финансах и технических областях.

Установка

  1. Приобретите Dragon Professional на сайте Nuance ($699 по состоянию на 2026)
  2. Скачайте установщик
  3. Запустите мастер установки
  4. Создайте голосовой профиль (начальное обучение занимает 5–10 минут)

Обучение голосового профиля

Голосовое обучение Dragon существенно повышает точность. В процессе настройки:

  1. Прочитайте предоставленные текстовые фрагменты (2–3 минуты чтения)
  2. Dragon анализирует особенности вашего голоса, акцент и речевые паттерны
  3. Профиль сохраняется в вашей учётной записи

Со временем точность дополнительно повышается — Dragon учится на ваших исправлениях.

Пользовательский словарь

Пользовательский словарь — главное конкурентное преимущество Dragon для профессиональных задач:

  1. Откройте редактор словаря Dragon
  2. Добавьте профессиональные термины (медицинские диагнозы, юридические ссылки, названия продуктов, технические термины)
  3. Для аббревиатур задайте письменную и произносимую форму (произносится: «компания», пишется: «ООО "Ромашка"»)

Для специалистов с узкоспециализированным словарём эта функция сама по себе оправдывает стоимость.

Основы работы с Dragon

Аналог режима «нажми-и-говори» в Dragon: нажмите и отпустите настраиваемую клавишу (по умолчанию — минус на цифровой клавиатуре), чтобы начать прослушивание. Скажите «stop listening» или снова нажмите клавишу для остановки.

Dragon также поддерживает голосовое управление приложениями — можно переключаться между программами, нажимать кнопки, ориентироваться в меню и управлять функциями Windows голосом. Это полезно для пользователей с ограниченными возможностями.

Вариант 3: современное AI-распознавание речи для Windows

Главный пробел на рынке Windows в 2026 году — отсутствие инструмента, объединяющего точность уровня Whisper с AI-обогащением текста в системном интерфейсе «нажми-и-говори». Такие инструменты есть на macOS (Telvr, Wispr Flow), но для Windows их ещё нет.

Что доступно пользователям Windows уже сейчас

Whisper Desktop (открытый код): Несколько сообщественных инструментов приносят Whisper на Windows. Наиболее поддерживаемые:

  • Whispering (GitHub) — записывает аудио, транскрибирует через локальный Whisper, вставляет в буфер обмена
  • FasterWhisper для Windows — требует настройки Python, более высокая производительность за счёт квантизованных моделей

Оба выдают сырую транскрипцию Whisper без обогащения. Настройка требует уверенного владения командной строкой.

Voice In (расширение Chrome): Расширение браузера, добавляющее голосовой ввод в любое текстовое поле Chrome. Использует Google Web Speech API, не Whisper. Точность хорошая для английского, ограниченная для других языков. Работает только в Chrome.

Telvr для Windows

Версия Telvr для Windows находится в разработке. После выхода она принесёт на Windows полный функционал: «нажми-и-говори», транскрипцию Whisper large-v3, шесть режимов AI-обогащения и системный ввод текста.

Подпишитесь на лист ожидания на сайте Telvr, чтобы узнать о выходе Windows-версии первым.

Настройка микрофона (применимо ко всем методам)

Качество микрофона важнее, чем выбор инструмента распознавания речи. Плохой микрофон ограничит точность вне зависимости от используемой модели.

Встроенный микрофон ноутбука

Приемлем в тихой обстановке. Может давать сбои при фоновом шуме, работе системы вентиляции или шуме открытого офиса.

Внешний USB-микрофон

Заметный шаг вперёд. Бюджетные USB-микрофоны ($50–100, Blue Yeti Nano, Rode NT-USB Mini) записывают значительно более чистый звук, чем встроенные в ноутбук. Улучшенный сигнал напрямую повышает точность распознавания.

Микрофон гарнитуры

Постоянное расстояние от микрофона до рта делает гарнитуры особенно удобными для диктовки. USB- и Bluetooth-гарнитуры работают одинаково хорошо; по возможности избегайте аналогового разъёма 3,5 мм — он чаще вносит помехи.

Настройка микрофона в Windows

  1. Откройте «Параметры» → «Система» → «Звук»
  2. В разделе «Ввод» выберите нужный микрофон
  3. Нажмите «Настроить микрофон» и следуйте мастеру калибровки
  4. Используйте индикатор уровня для проверки: сигнал должен быть достаточно сильным без перегрузки

Целевой уровень входного сигнала: Полоса громкости при обычной речи должна достигать примерно 75% максимума. Слишком тихо — слабее распознавание; слишком громко — перегрузка сигнала.

Устранение типичных проблем

Voice Typing не активируется (Win+H):

  • Убедитесь, что текстовое поле активно (кликните в него)
  • Проверьте разрешения микрофона: «Параметры» → «Конфиденциальность и безопасность» → «Микрофон»

Низкая точность в любом инструменте:

  • Попробуйте другой микрофон
  • Перейдите в более тихую обстановку
  • Говорите немного медленнее и чётче
  • В Dragon: запустите мастер настройки точности после нескольких часов использования

Текст появляется не там, где нужно:

  • Возможно, данное текстовое поле в этом приложении не поддерживает голосовой ввод
  • Убедитесь, что фокус стоит на нужном окне и поле

Большая задержка (долго ждать после речи):

  • Windows Voice Typing обрабатывается на серверах Microsoft — проверьте интернет-соединение
  • Dragon работает локально — проверьте загрузку CPU: другие ресурсоёмкие приложения могут замедлять его