Виндовс не распознает речь. Включение и выключение автоматического распознавания речи

06.07.2019

Операционная система Windows 7 оснащена многими опциями, которые дают все больше возможностей пользователям данной системы. В нее смогли внедрить весьма интересную функцию, которая носит название «распознование речи». Но что представляет собой данная система? Об этом и пойдет разговор.

Опция, о которой идет речь, позволяет применять в приложениях всей системы абсолютно новый способ взаимодействия пользователя с компьютером. Именно система «Распознавание речи Windows 7» допускает возможность управления компьютером, не используя при этом клавиатуру, мышь и другие средства.

Хочется отметить, что данная инновация будет доступна и в других продуктах Microsoft. Эта функция была замечена немного ранее, то есть ее попытались внедрить в Windows Vista, но в седьмой версии операционной системы компании Microsoft голосовое управление выполнено на более высоком уровне по сравнению с предшественником. Если сказать проще, такая опция, как распознавание речи Windows 7 стала еще более функциональной.

Кроме всего сказанного, хочется отметить, что она имеет довольно широкий спектр применения. Пользователи Windows 7 с функцией распознания речи имеют возможность запускать программы и конвертировать все звуковые фрагменты в текст, выполнять всевозможные команды на компьютере, используя всего лишь свой голос и необходимые приспособления. Но что же нужно для того, чтобы распознавание речи Windows 7 стало реальным?

В первую очередь, вам понадобится микрофон, который следует подключить к компьютеру. Кроме этого, необходимо приобрести специальное приложение или программу, которая издается самим производителем, то есть компанией Microsoft. После того как все необходимые компоненты будут установлены, а микрофон подключен к компьютеру, следует осуществить еще определенный план работы:

Необходимо выполнить тестовые голосовые команды и конвертировать их в текст.
После того как вы проведете обучение программы распознания, нужно будет создать шаблоны разных команд своим голосом. Именно на основе данной работы компьютер сможет принимать и выполнять все заданные вами команды.

Функция распознавание речи Windows 7 используется в текстовом редакторе компании Microsoft - WordPad. Она безотказно функционирует при заполнении различных форм, а также хорошо себя проявляет в работе в Internet Explorer и при

Кроме этого, данная опция без труда отредактирует записанный ранее текст, определив специальные голосовые команды. Конечно, в процессе распознавания той или иной задачи случаются типичные ошибки (когда происходит ошибочное распознавание некоторых звуков). На этот случай в программе предусмотрен список соответствий тех или иных слов.

Функция, конечно, феноменальная, но все же здесь есть одно «но». Все дело в том, что распознавание русской речи сейчас, в принципе, недоступно. Имеются отличные версии программы для английского, французского, немецкого и японского языка. Существуют также версии для китайской, испанской и итальянской речи.

Но вот данная новинка не совсем адаптирована для русской речи. Ваш компьютер не сможет воспринимать поставленные перед ним задачи, а значит, вам будет проще написать что-то при помощи клавиатуры или же выполнить определенные задачи с помощью мыши.

Конечно, вы можете попробовать поработать с подобными русскоязычными программами или же отдать свое предпочтение английскому языку, но все же остается надеяться, что в скором времени распознавание речи на русском языке тоже будет доступно в качественном режиме. И именно тогда вы сможете опробовать на практике такую уникальную функцию. Ведь она, без сомнения, явно упрощает работу на персональном компьютере и является огромным прорывом в сфере программирования. Так что остается лишь ждать.

19 октября 2016 в 20:47

Система распознавания речи Microsoft достигла человеческого уровня

Искусственный интеллект ,
IT-компании

Обучаемые нейронные сети Microsoft теперь распознают человеческий голос так же хорошо, как и люди. В докладе команды исследователей в области научного интеллекта Speech & Dialog сказано, что система распознавания речи теперь ошибается так же часто, как и профессиональные стенографисты. В некоторых случаях система способна совершать меньше ошибок.

Во время тестов коэффициент ошибочных слов (WER) составил 5,9%, что ниже предыдущего результата 6,3%, о котором Microsoft сообщила в прошлом месяце. Это самый низкий результат из когда-либо зарегистрированных. Команда не считает это прорывом в алгоритме или данных, но в тщательной настройке существующих архитектур AI. Основная сложность заключается в том, что
даже если звуковая дорожка хорошего качества и не содержит посторонних шумов, алгоритм должен бороться с разными голосами, перерывами, колебаниями и другими нюансами живой речи человека.

Чтобы проверить, насколько алгоритм способен повторить человеческие способности, Microsoft для чистоты эксперимента наняла стенографистов со стороны. У компании уже была готова правильная стенограмма аудиофайла, которая была предложен специалистам. Стенографисты работали в два этапа: сначала один человек перепечатывал аудио-фрагмент, а затем второй слушал и исправлял ошибки в расшифровке стенограммы. На основе верной стенограммы для стандартизированных тестов специалисты, расшифровывая запись разговора на конкретную тему, сработали на 5,9%, а результат расшифровки свободного диалога показал 11,3% ошибок. После 2 000 часов обучения человеческой речи, по этим же аудиофайлам система Microsoft набрала 5,9% и 11,1% ошибок соответственно. Это означает, что компьютер теперь может распознавать слова в разговоре так, если бы он был человеком. При этом команда выполнила цель, которую поставила перед собой меньше года назад, а результат значительно превзошел ожидания.

Теперь Microsoft собирается повторить такой же результат в шумной обстановке. Например, во время движения по шоссе или на вечеринке. Кроме того, компания планирует сосредоточить свое внимание на более эффективных способах помочь технологии распознавать отдельных спикеров, если они говорят одновременно, и убедиться, что AI хорошо работает с большим количеством голосов вне зависимости от возраста и акцента. Реализация этих возможностей в будущем имеет решающее значение и выходит за рамки простой стенографии.

Чтобы достичь таких результатов, исследователи использовали собственную разработку компании - вычислительную сеть Toolkit. Возможность этого нейросетевого инструментария быстро обрабатывать обучающие алгоритмы на нескольких компьютерах, работающих под управлением графического процессора, значительно улучшила скорость, с которой они могли производить исследования, и, в конечном счете, достичь человеческого уровня.

Такой уровень точности оказался возможным благодаря использованию трех вариантов сверточной нейронной сети . Первой из них стала архитектура VGG, отличающаяся большим числом скрытых слоев. По сравнению с сетями, которые использовались ранее для распознавания изображения, эта сеть применяет небольшие, более глубокие фильтры (3х3), а также использует до пяти сверточных уровней перед объединением. Вторая сеть смоделирована на архитектуре ResNet, которая добавляет магистральные соединения. Единственное отличие заключается в том, что разработчики применили пакетную нормализацию перед тем, как вычислить ReLU . Последняя сверточная сеть в списке - LACE. Это вариант нейронной сети с временной задержкой, в котором каждый более высокий уровень – нелинейное преобразование взвешенных сумм окон фреймов нижнего уровня. Другими словами, каждый более высокий уровень использует более широкий контекст, чем нижние уровни. Нижние уровни фокусируются на извлечении простых локальных структур, в то время как более высокие уровни извлекают более сложные структуры, которые покрывают более широкие контексты.

Это достижение является для компании еще одним шагом на пути к легкому и приятному общению с компьютером. Но до тех пор, пока компьютер не может понимать смысл того, что ему говорят, он не сможет правильно выполнить команду или ответить на вопрос. Здесь задача намного сложнее. И она ложится в основу того, чем собирается заниматься Microsoft в ближайшие годы. Ранее в этом году Сатья Наделла говорил о том, что искусственный интеллект является «будущим компании», и его способность общаться с человеком стала краеугольным камнем. «Следующий рубеж – это переход от признания к пониманию» - сказал Джеффри Цвейг, руководитель исследовательской группы Speech & Dialog.

Несмотря на очевидный успех, между автоматической системой и работой стенографистов есть одна большая разница: она не может понимать тонкие разговорные нюансы вроде звука «э-э». Мы можем произносить данный звук непроизвольно, чтобы чем-то «забить» паузу во время обдумывания следующей мысли, которую нужно сказать. Или «э-э» может быть сигналом о том, что собеседник может продолжать говорить, как и «ага». Профессиональные стенографисты способны отличить их между собой, но эти небольшие сигналы теряются для искусственного интеллекта, который не в состоянии понять контекст, в котором был произнесен тот или иной звук.

«Еще пять лет назад я бы даже подумать не мог, что мы могли бы добиться такого результата. Я просто не думал бы, что это возможно» - отметил Гарри Шам, исполнительный вице-президент, возглавляющий группу исследований искусственного интеллекта Microsoft.

Первые исследования в области распознавания речи можно отнести к 1970-м годам, когда агентство передовых оборонных исследовательских проектов США (DARPA) поставило задачу создать прорывную технологию в интересах национальной безопасности. На протяжении десятилетий большинство крупнейших ИТ-компаний и множество научно-исследовательских организаций включились в гонку. «Это достижение является кульминацией более чем двадцати лет усилий», отмечает Джеффри Цвейг.
Microsoft считает, что результат работы над распознаванием речи окажет большое влияние на развитие потребительских и бизнес-продуктов компании, число которых существенно увеличится. Новые возможности из уже существующих разработок получат, как минимум, Xbox и Cortana. Кроме того, каждый пользователь сможет воспользоваться инструментами мгновенного перевода речи в текст.

Так как я видел мой первый Sci-Fi кино фильм, я хотел бы иметь технологии которые они используют. Я до сих пор не видел летающих кораблей в таком масштабе, телепортация устройств, роботов, которые могут танцевать или других подобных устройств. Тем не менее, я нашел кусок этой мечты включенной в приложение Windows Vista - Windows Speech Recognition - Распознавание речи.

Этот инструмент пытается понять, что вы говорите и преобразует произнесенные слова в машиночитаемый ввод, такой как нажатие клавиш или Windows команды, ограничивая тем самым необходимость использования мыши и клавиатуры. В этом уроке я покажу вам, как настроить Windows Speech Recognition - Распознавание речи Windows , и научу как использовать её и дать вам некоторые сведения об общих вопросах по этому приложению. Для того чтобы использовать Windows Speech Recognition – Распознавание речи Windows вам нужен микрофон. Чтобы узнать, как настроить его, читайте статью о том, как установить и настроить микрофон в Vista.

Как установить Windows Speech Recognition

После того как вы установили свой микрофон, вfv нужно тренироваться c Распознаванием речи в Windows , чтобы понять ваш голос. Чтобы сделать это, откройте окно Control Panel – Панель управления и нажмите на – Получить доступ.

Если вы используете классическое управление Группами, перейдите в Control Panel -> Ease of Access Center – Панель управления-> Центр Специальных возможностей. Когда вы находитесь в окне Постой доступ, нажмите на Speech Recognition Options – Функции распознавания речи.

В окне Speech Recognition Options – Функции распознавания речи нажмите на Start Speech Recognition – Начать Распознавание речи.

Появится Мастер установки. Чтобы начать настройку, нажмите на кнопку Next – Следующий.

Выберите устройства микрофон, которые в настоящее время используются и нажмите на кнопку Next – Следующая.

Если следовать данным указаниям, они дадут вам лучший результат. В моем случае, так как я выбрал микрофон с гарнитурой, указания были, как показано ниже. После прочтения и после данной консультации, нажмите кнопку Next – Следующая.

Примечание: Если вы случайно выбрали неверное устройство или вы просто хотите, чтобы вернуться к предыдущей странице Настройка, нажмите на синюю стрелку Back – назад в левом верхнем углу окна мастера установки.

Прочитайте текст вслух, после чего нажмите кнопку Next- Следующая.

Эта процедура, может быть немного с ошибками, поэтому вы можете повторить её несколько раз, и отрегулировать положение микрофона и его расстояние от динамиков.

Примечание: Если вы уже пытались несколько раз сделать настройки, и микрофон еще не работает, закройте мастер и проверьте статю о том, как установить и настроить Микрофон. Когда микрофон установлен правильно, повторите процедуру, описанную в этой статье.

Если вы читали текст и нажали кнопку Next – Далее , мастер скажет, что микрофон был установлен. Нажмите на кнопку Next - Готово .

После настройки микрофона, мастер попытается повысить точность распознавания речи. Мастер установки спросит вашего разрешения, чтобы приложение усовершенствовалось, используя тексты из документов или по почте. После того как вы выберите нужный вариант, щелкните Next - Далее .

В настоящее время мастер даст вам ссылку на карту речи, которая содержит список команд компьютера, на которые он будет отвечать. Если вы нажмете на View Reference Sheet – Показать лист ссылок , Вы можете видеть команды, а также распечатать их.

Когда закончите, нажмите кнопку Next - Далее .

Примечание: лист ссылок можно прочитать и распечатать в любое дополнительное время, просто зайдите в Access -> Speech Recognition Options -> Open the Speech Reference Card - Панель управления-> Специальные возможности-> Параметры распознавания речи-> открыть Карту ссылок речи .

Можно сделать приложение,которое запускается каждый раз при запуске Windows Vista , проверяя вариант “ Run Speech Recognition at startup – Выполнить Распознавание речи при запуске ” . Если вы оставите его без внимания, приложение нужно будет запускать каждый раз в ручную, когда вы захотите его использовать.

Узнайте, как использовать Windows Speech Recognition

Как только вы закончите с настройкой, вам будет предложено пройти урок и научиться его использовать. Нажмите на вход для входа в Учебник.

ВАЖНО: Я не могу дать вам указания о содержании учебника. Я считаю, что руководство хорошо написано и содержит всю необходимую информацию. Пожалуйста, найдите время 10-15 минут, чтобы прочитать это. Хотя это может показаться на первый взгляд разочарованием,но в итоге, вы будете довольны результатами.

Если вы закончили урок, и вы думаете, что Распознавание речи Windows не слышит голосовые команды достаточно хорошо, Вы можете взять тот же учебник снова. Для этого перейдите в параметры Windows Speech Recognition – Распознавание речи и нажмите Take Speech Tutorial – Возьмите Учебник речи .
Если вы прочитали учебник, но вы все ещё чувствуете необходимость улучшения методов в работе с Распознаванием речи в Windows , вы можете сделать еще один учебник на основе чтения текстов. Чтобы открыть и использовать текстовый учебник, нажмите ‘ Train you computer to better understand you – Тренировка вашего компьютера, чтобы лучше понять вас ” находится в окне параметры Speech Recognition Options – Распознавание речи.

Рекомендации : Пройдите уроки ‘ Train your computer to better understand you – Обучение компьютеру, чтобы лучше его понять “ несколько раз. Даже если вы делаете ошибки первые несколько раз, менее чем за 3 дня и пару часов в день, вы будете удивляться, как вы могли жить без этого приложения. Вместо того, чтобы закрыть приложение, просто нажмите остановить прослушивание или нажмите с клавиатуры Ctrl + Windows .

Известные проблемы

Некоторые приложения могут не работать с Распознаванием речи в Windows . Это потому, что приложения должны иметь поддержку текстовых служб. Структура была построена Microsoft, чтобы включить дополнительный ввод текста, распознавание речи и поддержку в приложениях. Таким образом, если разработчики не включили Text Services Framework , когда они построили их применения, Распознавание речи в Windows не будет работать должным образом с их применением.

Распознавание речи в Windows не работает, когда появится предупреждение UAC (User Account Control) . В таких случаях с помощью мыши или клавиатуры, выберите опцию UAC которую вы хотите.

В этом документе описывается предварительная версия программного обеспечения Microsoft® Windows Vista™.

Сведения, содержащиеся в документе, отражают позицию корпорации Майкрософт в отношении обсуждаемых вопросов на момент публикации. Поскольку корпорация Майкрософт должна реагировать на изменение рыночных условий, данный документ не может рассматриваться как обязательство с ее стороны, и корпорация Майкрософт не гарантирует точности представленных сведений. Данный документ носит исключительно информационный характер. КОРПОРАЦИЯ МАЙКРОСОФТ НЕ ПРЕДОСТАВЛЯЕТ В ДАННОМ ДОКУМЕНТЕ НИКАКИХ ГАРАНТИЙ, ЯВНЫХ ИЛИ ПОДРАЗУМЕВАЕМЫХ.

Аннотация

С помощью средств распознавания речи в операционной системе Microsoft® Windows Vista™ можно диктовать сообщения электронной почты и документы, а также использовать голосовые команды для управления работой программ и отображением веб-страниц. Точность распознавания мирового уровня, адаптация программы к произношению пользователя и используемой лексике заметно ускоряют создание документов. Новейшие средства речевого управления в Windows Vista помогает пользователю освоить речевой ввод быстрее, чем когда бы то ни было. Данное руководство содержит системные требования, инструкции по установке и пошаговое руководство к использованию средств распознавания речи в Windows Vista.

Пошаговое руководство по использованию средств распознавания речи в Windows Vista

Средства распознавания речи в Windows Vista являются результатом новейших разработок в этой области. С помощью средств распознавания речи можно диктовать сообщения электронной почты и документы, а также пользоваться голосовыми командами для управления работой программ и отображением веб-страниц. Средства распознавания речи в Windows Vista позволяют ускорить работу, а также снизить риск возникновения травм от постоянного напряжения. Усовершенствованная реализация средств распознавания речи в Windows Vista предоставляет пользователю широкие возможности управления и позволяет освоить голосовой ввод быстрее, чем это было возможно раньше.

Что такое распознавание речи

Технология распознавания речи позволяет взаимодействовать с компьютером с помощью голоса. Программа определяет, следует ли интерпретировать произносимые слова как текст (например, создаваемого документа или сообщения электронной почты) либо как команду, требующую выполнения определенного действия.

Новые возможности средств распознавания речи в Windows Vista

Средства распознавания речи в Windows Vista ориентированы не только на обеспечение наивысшей точности распознавания, но и на формирование наиболее удобного пользователю механизма взаимодействия с компьютером. Сделана попытка устранить основные проблемы и неудобства, с которыми сталкиваются пользователи существующих продуктов аналогичного назначения. Эффективность выполнения работы с помощью средств распознавания речи в Windows Vista сочетается с удовольствием от их применения. Это достигается благодаря таким особенностям, как:

Сокращенный период обучения системы, позволяющий сразу начинать работу;

Обновленный пользовательский интерфейс предоставляет простые, но эффективные способы диктовки и редактирования текста, а также исправления ошибок;

Интерактивный курс обучения работе со средствами распознавания речи, в процессе которого компьютер адаптируется к особенностям голоса и произношения пользователя;

Значительное повышение точности распознавания речи благодаря самообучению системы в процессе работы с ней;

Новые средства управления, предоставляющие пользователю полный контроль над приложениями;

Усовершенствованные средства интерпретации. Если озвученная команда не может быть истолкована однозначно, система запросит уточнение действия к выполнению.

Кому будет полезно использование средств распознавания речи

Данное руководство предназначено для следующих категорий пользователей:

Планировщиков ИТ-отделов и отделов управления персоналом, работающих со вспомогательными технологиями для работников с травмами от постоянного напряжения, ограничениями подвижности или ослабленным зрением.

ИТ-специалистов, выполняющих планирование для обучающих отделов.

Ранних пользователей продукта.

Примечание переводчика. Средства распознавания речи доступны только в английской версии Windows Vista. Для их использования необходимо знание английского языка.

Средства распознавания речи в первую очередь ориентированы на запросы пользователей, работающих преимущественно с электронной почтой, текстовыми редакторами и браузерами.

Использование средств распознавания речи Windows Vista будет наименее эффективным для следующих категорий пользователей:

Пользователей, работающих с текстами не на естественных языках (программистов, составителей электронных таблиц, системные администраторы).

Пользователей, которым нужна программа, сочетающая в себе функции экранного диктора и средств распознавания речи.

Преимущества использования средств распознавания речи

С помощью средств распознавания речи пользователи могут:

Значительно сократить использование клавиатуры и мыши, выполняя задачи с помощью голосовых команд.

Полностью создавать документы, пользуясь только речью.

Управлять компьютером, в том числе запускать приложения и переключаться между ними, а также осуществлять выбор пунктов меню и нажатие кнопок.

Основные варианты использования средств распознавания речи

В данном руководстве рассматривается простой пример диктовки документа и выполнения голосовых команд.

В Speech Tutorial, входящем в состав Windows Vista, содержится больше примеров, которые можно изучить в случае необходимости.

Необходимые условия

Для выполнения этой задачи необходимо:

Использование качественного микрофона, например:

Гарнитуры, подключаемой через порт USB
Микрофона с технологией Array microphone

Завершение интерактивного курса обучения работе со средствами распознавания речи. Это позволит компьютеру получить базовую информацию для точного распознавания речи пользователя, а пользователю познакомиться с голосовыми командами, необходимыми для выполнения различных задач.

Диктовка документа

Одной из задач, наиболее часто выполняемых с помощью средств распознавания речи, является диктовка документа. Выполнение этой задачи проходит в три этапа:

Открытие текстового редактора

Диктовка текста документа

Сохранение документа

Последовательность действий при диктовке документа

Пройдите полностью курс обучения Speech Tutorial

Создание, диктовка и сохранение документа

Известные проблемы
Диктовка

При работе с распознаванием речи необходимо учитывать следующие особенности.

Диктовка при работе с распознаванием речи работает только с ограниченным набором приложений, поддерживающих технологию Text Services Framework. К этим приложениям относятся:

Microsoft Word и Outlook
Практически все приложения, входящие в состав Windows Vista.

Распознавание речи при диктовке не будет работать в некоторых приложениях, в том числе:

Microsoft PowerPoint

Неточное распознавание речевых команд

Наиболее вероятной причиной возникновения проблем при управлении компьютером с помощью речи являются не ошибки компьютера в распознавании слов, а произнесение неверных команд.

Обратитесь к Speech Reference Card, чтобы увидеть список доступных команд. Speech Reference Card открывается после щелчка правой кнопкой мыши по панели управления микрофоном.

Отчеты об ошибках и обратная связь

Чтобы отправить отчет об ошибке, воспользуйтесь инструкциями на веб-странице Microsoft Beta Web site. Мы также ждем предложений о полезных функциях и заинтересованы в обратной связи с пользователями средств распознавания речи.

Запросы дополнительной поддержки при использовании средств распознавания речи направляйте непосредственно в службу поддержки средств распознавания речи, по электронному адресу [email protected].

Дополнительные ресурсы

Бета-тестеры, участвующие в программе технологической адаптации (Technology Adoption Program, TAP), могут также обращаться за поддержкой к прикрепленному участнику команды разработчиков корпорации Microsoft.

Что вы будете делать, если вы устали от ручного ввода данных, запускать программы, написать по электронной почте и делать другие вещи в вашей Windows 8/8 .1 на компьютере?Возможно, вам нужно будет сделать перерыв и начать делать задания снова.Почему Вы не включите распознавание речи Windows,чтобы помочь вам реализовать все эти операции?Распознавание речи в Windows позволяет вам делать всё,что можно сделать с помощью мыши и клавиатуры,голосом. И если вы беспокоитесь о том,где вы можете найти распознавание речи в Windows в компьютере,этот пост покажет вам 3 способа, чтобы включить распознавание речи в Windows , и расскажет,как его отключить.

1.Три способа включения распознавания речи в Windows 8/8 .1:

Способ 1 : Включите распознавание речи в панели управления.

Шаг 1: Откройте меню быстрого доступа с помощью сочетания клавиш Windows key+X и затем выберите Панель Управления .

Шаг 2: в панели управления выберите Легкость доступа чтобы войти в него.

Шаг 3: Как только вы щёлните на легкость доступа, откроется окно, выберите Запуск распознавания речи под вариантом распознавание речи.

Способ 2 : Откройте распознавания речи в » Приложения» на экране.

Шаг 1. на начальном экране (или интерфейс Metro), правой кнопкой нажмите на значок или в любой пустой области и в нижнем правом углу выберите Все приложения .

Шаг 2: на экране приложений, найдите Распознавание Речи Windows и откройте его с помощью мыши.

Способ 3 : Включите его через панель поиска.

Шаг 1: Откройте панель поиска с помощью клавиш ключей Windows+F ивведите в пустое поле распознавание речи и выберите в списке поиска Приложения .

Шаг 2: слева от панели поиска, когда появятся результаты поиска, можно выбрать Распознавание речи Windows .