Варианты голосового ввода в Windows
Windows предлагает больше вариантов распознавания речи, чем любая другая десктопная платформа — от полностью бесплатных встроенных инструментов до профессиональных корпоративных решений. Настройка нужного варианта займёт от двух минут до нескольких часов в зависимости от требований.
В этом руководстве рассматриваются три уровня: встроенный Windows Voice Typing, доступный сразу; Dragon Professional для специализированных профессиональных задач; и актуальное состояние современных AI-инструментов для тех пользователей Windows, кому встроенного решения недостаточно.
Вариант 1: Windows Voice Typing (встроенный)
Windows Voice Typing — самый быстрый путь к голосовому вводу в Windows. Не требует установки, доступен в Windows 10 версии 20H2 и новее, а также в Windows 11.
Настройка
- Нажмите Win + H в любом приложении с активным текстовым полем
- В верхней части экрана появится виджет с микрофоном
- Нажмите кнопку микрофона или снова нажмите Win+H
- Начните говорить
Всё. Никакой установки, никакой учётной записи, никакой настройки для базового использования.
Включение автоматической пунктуации
Автоматическая пунктуация (Windows 11 и свежие сборки Windows 10) расставляет запятые и точки автоматически — произносить их вслух не нужно.
- Нажмите Win+H, чтобы открыть Voice Typing
- Нажмите значок шестерёнки в виджете
- Включите «Auto-punctuation»
Настройка языка
Если вы хотите диктовать не на языке системы по умолчанию:
- Откройте «Параметры» → «Время и язык» → «Язык и регион»
- Добавьте нужный языковой пакет
- Загрузите пакет распознавания речи для этого языка
- Перед диктовкой переключите язык ввода через индикатор языка в панели задач
Поддерживаемые языки Windows Voice Typing (по состоянию на 2026): английский (США, Великобритания, Австралия, Индия), китайский (упрощённый и традиционный), французский, немецкий, испанский, итальянский, португальский, японский, корейский, арабский и около 15 других. Полный список — в официальной документации Microsoft.
Голосовые команды Voice Typing
Windows Voice Typing поддерживает несколько голосовых команд:
- «Stop listening» — отключает микрофон
- «Delete that» — удаляет последний надиктованный текст
- «Scratch that» — удаляет последнее высказывание
- «Go to sleep» / «Wake up» — переключает состояние прослушивания
Ограничения
Windows Voice Typing выдаёт сырую транскрипцию. Нет AI-обогащения, нет форматирования писем, нет структурированного вывода. Слова-паразиты попадают в текст. Автоматическая пунктуация работает при включении, но сложные конструкции могут потребовать ручной правки.
Инструмент хорошо подходит для повседневной диктовки, когда вы готовы к редактированию. Если нужен профессиональный текст без правок — это не тот инструмент.
Вариант 2: Dragon Professional (Windows)
Dragon Professional — выбор для пользователей Windows, которым нужна профессиональная точность со специализированным словарём — прежде всего в юриспруденции, медицине, финансах и технических областях.
Установка
- Приобретите Dragon Professional на сайте Nuance ($699 по состоянию на 2026)
- Скачайте установщик
- Запустите мастер установки
- Создайте голосовой профиль (начальное обучение занимает 5–10 минут)
Обучение голосового профиля
Голосовое обучение Dragon существенно повышает точность. В процессе настройки:
- Прочитайте предоставленные текстовые фрагменты (2–3 минуты чтения)
- Dragon анализирует особенности вашего голоса, акцент и речевые паттерны
- Профиль сохраняется в вашей учётной записи
Со временем точность дополнительно повышается — Dragon учится на ваших исправлениях.
Пользовательский словарь
Пользовательский словарь — главное конкурентное преимущество Dragon для профессиональных задач:
- Откройте редактор словаря Dragon
- Добавьте профессиональные термины (медицинские диагнозы, юридические ссылки, названия продуктов, технические термины)
- Для аббревиатур задайте письменную и произносимую форму (произносится: «компания», пишется: «ООО "Ромашка"»)
Для специалистов с узкоспециализированным словарём эта функция сама по себе оправдывает стоимость.
Основы работы с Dragon
Аналог режима «нажми-и-говори» в Dragon: нажмите и отпустите настраиваемую клавишу (по умолчанию — минус на цифровой клавиатуре), чтобы начать прослушивание. Скажите «stop listening» или снова нажмите клавишу для остановки.
Dragon также поддерживает голосовое управление приложениями — можно переключаться между программами, нажимать кнопки, ориентироваться в меню и управлять функциями Windows голосом. Это полезно для пользователей с ограниченными возможностями.
Вариант 3: современное AI-распознавание речи для Windows
Главный пробел на рынке Windows в 2026 году — отсутствие инструмента, объединяющего точность уровня Whisper с AI-обогащением текста в системном интерфейсе «нажми-и-говори». Такие инструменты есть на macOS (Telvr, Wispr Flow), но для Windows их ещё нет.
Что доступно пользователям Windows уже сейчас
Whisper Desktop (открытый код): Несколько сообщественных инструментов приносят Whisper на Windows. Наиболее поддерживаемые:
- Whispering (GitHub) — записывает аудио, транскрибирует через локальный Whisper, вставляет в буфер обмена
- FasterWhisper для Windows — требует настройки Python, более высокая производительность за счёт квантизованных моделей
Оба выдают сырую транскрипцию Whisper без обогащения. Настройка требует уверенного владения командной строкой.
Voice In (расширение Chrome): Расширение браузера, добавляющее голосовой ввод в любое текстовое поле Chrome. Использует Google Web Speech API, не Whisper. Точность хорошая для английского, ограниченная для других языков. Работает только в Chrome.
Telvr для Windows
Версия Telvr для Windows находится в разработке. После выхода она принесёт на Windows полный функционал: «нажми-и-говори», транскрипцию Whisper large-v3, шесть режимов AI-обогащения и системный ввод текста.
Подпишитесь на лист ожидания на сайте Telvr, чтобы узнать о выходе Windows-версии первым.
Настройка микрофона (применимо ко всем методам)
Качество микрофона важнее, чем выбор инструмента распознавания речи. Плохой микрофон ограничит точность вне зависимости от используемой модели.
Встроенный микрофон ноутбука
Приемлем в тихой обстановке. Может давать сбои при фоновом шуме, работе системы вентиляции или шуме открытого офиса.
Внешний USB-микрофон
Заметный шаг вперёд. Бюджетные USB-микрофоны ($50–100, Blue Yeti Nano, Rode NT-USB Mini) записывают значительно более чистый звук, чем встроенные в ноутбук. Улучшенный сигнал напрямую повышает точность распознавания.
Микрофон гарнитуры
Постоянное расстояние от микрофона до рта делает гарнитуры особенно удобными для диктовки. USB- и Bluetooth-гарнитуры работают одинаково хорошо; по возможности избегайте аналогового разъёма 3,5 мм — он чаще вносит помехи.
Настройка микрофона в Windows
- Откройте «Параметры» → «Система» → «Звук»
- В разделе «Ввод» выберите нужный микрофон
- Нажмите «Настроить микрофон» и следуйте мастеру калибровки
- Используйте индикатор уровня для проверки: сигнал должен быть достаточно сильным без перегрузки
Целевой уровень входного сигнала: Полоса громкости при обычной речи должна достигать примерно 75% максимума. Слишком тихо — слабее распознавание; слишком громко — перегрузка сигнала.
Устранение типичных проблем
Voice Typing не активируется (Win+H):
- Убедитесь, что текстовое поле активно (кликните в него)
- Проверьте разрешения микрофона: «Параметры» → «Конфиденциальность и безопасность» → «Микрофон»
Низкая точность в любом инструменте:
- Попробуйте другой микрофон
- Перейдите в более тихую обстановку
- Говорите немного медленнее и чётче
- В Dragon: запустите мастер настройки точности после нескольких часов использования
Текст появляется не там, где нужно:
- Возможно, данное текстовое поле в этом приложении не поддерживает голосовой ввод
- Убедитесь, что фокус стоит на нужном окне и поле
Большая задержка (долго ждать после речи):
- Windows Voice Typing обрабатывается на серверах Microsoft — проверьте интернет-соединение
- Dragon работает локально — проверьте загрузку CPU: другие ресурсоёмкие приложения могут замедлять его