Голосовой набор цифр на компьютере. Голосовой ввод

22.08.2019

Приветствую вас, уважаемые читатели блога сайт! Давно собирался подготовить заметку о программах и онлайн сервисах, при помощи которых можно переводить свой голос прямо в текст. Как рассказчик (мне кажется), я неплохой, но вот излагать свои мысли в виде печатного текста мне дается с большим усилием. Вот я и задался целью найти «чудо-сервис», который смог бы мою речь преобразовать в текст.

Актуальность набора текста голосом на сегодняшний день очевидна. Ведь не зря разработчики Google «вкрутили» в свой браузер Google Chrome голосовой поиск. И уже на основе этого открытого кода некоторые программисты и Web мастера сделали разные блокноты и сервисы для преобразования речи в текст в онлайн режиме. Для многих пользователей и особенно пользователей с ограниченными возможностями это просто незаменимые сервисы.

Попробовав в работе один из сервисов, которые я приведу ниже, возможно, не каждый получит желаемый результат. Особенно те, кто постоянно набирают тексты на компьютере, и для кого с текстами является основным источником дохода. И многие хотели бы как-то облегчить этот нелегкий труд. Но, если немного потренироваться, перевод голоса в текст в этих онлайн сервисах может получаться вполне качественный.

Чтобы приступить к преобразованию голоса в текст, понадобится микрофон (в ноутбуках он встроенный), желательно хорошая скорость интернет соединения и браузер Google Chrome не ниже 25 версии. В других браузерах функция голосового набора текстов, к сожалению, не работает. Как я уже говорил, код голосового распознавания в текст от разработчиков Google является открытым, и его можно использовать на своем сайте. Вот и я немного его русифицировал и установил на свой блог.

Голосовой ввод текста с помощью Web Speech API

Запустите страницу для ввода текста голосом в браузере Chrome. Внизу окна выберите язык, на котором вы планируете диктовать текст. Нажмите на иконку микрофона в верхнем правом углу. И в всплывшей строке нажмите кнопку «разрешить» использование браузером микрофона.

Теперь вы можете неспеша и четко наговаривать недлинные фразы. После завершения надиктовки текста голосом его можно выделить и при помощи комбинации клавиш на клавиатуре Ctrl+C скопировать в буфер обмена, а затем вставить в любой редактор для обработки. При желании текст можно сразу отправить по электронной почте.

Пожалуй, Web Speech API – самый простой и довольно качественный способ преобразовать свою речь в текст. Так как не надо отвлекаться на какие-то дополнительные манипуляции с клавиатурой. Просто включил микрофон и говори текст. В любом случае придется использовать какой-нибудь дополнительный текстовый редактор для дальнейшей корректировки надиктованного текста.

Преобразование речи в текст на странице сайта Online Dictation

Простой «буржуйский» блокнот, расположенный на странице Dictation , имеет всего три кнопки. Включить микрофон для записи, очисть поле для ввода текста и экспортировать надиктованный текст на свой компьютер, Google Диск, хранилище Dropbox или отправить электронной почтой в текстовом формате TXT. Все очень просто. Пробуйте, тестируйте и наслаждайтесь полученным результатом.

Набор текста голосом - онлайн сервис Talk Typer

Этот «буржуйский» онлайн блокнот распознавания голоса имеет несколько дополнительных встроенных функций. Возможность заменять продиктованные слова на другие предложенные варианты. Вставлять знаки пунктуации. Прослушать надиктованный текст, нажав на иконку динамик. Сделать перевод на выбранный иностранный язык. При желании можно изменить отображение внешнего вида и размер шрифта, нажав на иконку «шестеренка». Единственное неудобство: после каждой произнесенной фразы ее надо сбрасывать в нижнюю часть блокнота, нажимая на стрелку, и затем снова включать микрофон. В целом, это полноценный сервис, в котором можно преобразовать речь в текст и отредактировать его по своему усмотрению. Готовый текст можно распечатать, Твитнуть или отправить на электронную почту.

Распознавание голоса в блокноте VoiceNote

Этот сервис распознавание голоса в текст можно установить как приложение в браузер Chrome, или просто добавить в закладки сайт , который находится . Войснот по функционалу практически ничем не отличается от предыдущего сервиса-блокнота распознавания речи Talk Typer. Такой же основной минус, после каждой произнесенной фразы надо снова включать микрофон. Но зато не надо перемещать надиктованный текст, как в Talk Typer. Простой и очень удобный интерфейс сервиса для преобразования текста. Думаю, что он многим придется по душе. Тестируйте и делайте выводы.

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

2 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

3 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, в 2018-ом году такой возможности нет. Сильно смущает тот момент, что транскрибированный файл доступен всем пользователям для скачивания, возможно это будет доработано.

Контакты разработчика (ВКонтакте, Facebook, Youtube, Твиттер, электронная почта, телефон) программы можно найти на странице его сайта (точнее, в подвале сайта):

4 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели , например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

Статьи и Лайфхаки

Далеко не каждый пользователь в курсе, что существует голосовой набор на андроид, как включить эту функцию тоже представляют себе не все. А ведь если посмотреть , перечень выпущенных моделей, становится ясно, что практически каждое современное устройство оснащено ею. Расскажем, как начать применять голосовой набор, используя стандартные варианты, предложенные системой, или же сторонние приложения.

Базовый ввод голосовых команд предполагает диктовку текста своему мобильному устройству без использования клавиш. Чтобы иметь возможность использовать данную функцию, необходимо проделать несколько простых и последовательных действий. Начнём с того, что поместим курсор в любое поле для ввода текста. Нам будет предложено использование клавиатуры Android. Находим рисунок микрофона и нажимаем на него. Перед нами появится панель для голосового ввода, где будут несколько важных элементов, включая список языков, голосовой индикатор и клавишу «Готово», на английском «Done» (переводит в обычный текстовый режим).

По умолчанию на одном из рабочих столов нашего смартфона установлен виджет поиска Google, где также есть иконка с изображением микрофона. Путём нажатия на неё мы сможем активировать функцию голосового набора.

Как управлять этой функцией? Следует знать о том, что красная рамка, находящаяся вокруг рисунка микрофона, меняет свою толщину в зависимости от того, насколько громким является наш голос. По мере обработки команд они будут появляться в виде слов в поле.

Добавим, что функция работает только при активном подключении к Интернету. Язык ввода выбирается в специальном поле («Select dictation language» > «Add languages», то есть «Добавить языки»). Теперь можно пользоваться голосовым набором без каких-либо проблем.

Теперь мы имеем представление о том, что такое голосовой набор на андроид, как включить его и как им пользоваться. Однако следует знать, что активировать эту функцию можно теми же путями, : т. е. не только встроенными средствами системы, но и при помощи сторонних программ.

Неплохой программой является Voice Button. Её можно найти и загрузить из Play Market. Это хорошее приложение для голосового управления всей домашней техникой. Оно построено на основе базового модуля сотового аппарата Android, а также модуля Arduino.

После самого первого запуска приложения переходим в «Настройки» («Settings»), после чего выбираем «Пожалуйста, нажимайте и говорите» («Please click and tell»). Откроется окно с изображением микрофона. Произносимые нами голосовые команды будут появляться в верхнем поле. Чтобы сохранить какую-либо команду и привязать её к определённой кнопке, стоит нажать на эту кнопку с надписью «Изменить голосовую команду №» («Change Voice command №»). Текст команды будет отображаться в скобках.

Ещё одной хорошей программой является Cyberon Voice Commander. Она отличается высокой степенью точности. Приложение позволяет совершать исходящие звонки, запускать другие программы и т.д. Функция голосового набора сопряжена с беспроводной Bluetooth гарнитурой.

Недостатком этого приложения является то, что оно предлагается на платной основе. Его цена составляет $5,99.

Голосовой ввод текста на Андроиде – это удобно даже при обычном наборе смс, а если вам нужно набирать большие объемы текста в день или решать деловые вопросы параллельно с другими рабочими обязанностями, то эта функция станет просто незаменимой.

В ОС Андроид имеется стандартная функция диктовки слов голосом, которую можно включить в настройках, не скачивая дополнительных приложений. Система автоматически добавит значок микрофона на электронную клавиатуру, и вы сможете пользоваться ею тогда, когда вам нужно.

Если включенный ввод вам больше не нужен, и вы хотите его отключить, в этом же меню выберите кнопку «Отключить» или снимите галочку с соответствующего пункта.

Как пользоваться голосовым вводом

Как включить эту функцию, мы уже разобрались, теперь нужно понять, как ею пользоваться. Она будет доступна практически во всех меню и приложениях, в которых можно использовать электронную клавиатуру.

  1. Чтобы начать диктовку текста, нажмите на текстовый экран или на ту часть текста, которая уже была введена. Высветиться стандартная электронная клавиатура.
  2. Нажмите на значок микрофона на главном экране, или же перейдите в раскладку символов, если вы перенесли клавишу с микрофоном туда при настройке.
  3. На экране отобразится меню для записи вашего голоса и надпись: «Говорите». Надиктуйте нужный текст в микрофон смартфона, и он автоматически преобразует голос в текст.

Знаки пунктуации нужно проговаривать словами: «Вопросительный знак», «Запятая», «Точка». Старайтесь говорить четче, иначе программа может неправильно понять ваши слова, соответственно, преобразовать их в схожие по звучанию.

Какие настройки доступны при распознавании голоса Андроидом

Настроить работу стандартного голосового ввода на Android можно в меню «Язык и ввод», в который можно попасть через «Настройки», или же нажав на «шестеренку» настроек прямо в меню, которое высветилось после нажатия микрофона (обычно кнопка настроек находится слева от слова «Говорите»).

Настройка распознания речи. Здесь можно сделать следующее:

  • Выбрать язык. Распознавание доступно и в офлайн режиме, но по умолчанию у вас будет установлен только русский язык (или же русский + английский). Для других языков функция будет работать либо только при , либо тогда, когда вы скачаете нужные языки. Скачать нужные языковые пакеты можно в меню настроек языка и ввода, нажав на «Распознавание речи офлайн».
  • Настроить распознавание «О’кей Google». После настройки этого пункта, вы сможете использовать менеджер поисковой системы при открытой системе Google, только сказав: «О’кей Google». А потом надо произнести, что вам нужно найти в поисковике.
  • Включить возможность управления голосом с проводной гарнитуры или Bluetooth-устройств.
  • Настроить распознавание нецензурных слов. Программа автоматически включает пункт «Скрывать распознанные нецензурные слова».
  • Включить или выключить озвучивание результатов в стандартном режиме или в режиме подключенной гарнитуры.

Всем, кто часто использует компьютер, знакома проблема с набором длинных текстовых сообщений. Особенно часто приходится набирать тексты студентам, блогерам, журналистам и другой пишущей братии. Чтобы написать одну полноценную статью требуется пять-шесть часов напряженного труда, а для узкопрофессиональных текстов это время значительно увеличивается. Для тех, кто не любит набирать много букв на клавиатуре, придуманы специальные программы, позволяющие преобразовывать звуковые сообщения в текстовые файлы. Подобные возможности можно найти в специальных приложениях, разработанных для различных устройств. «Голосовой блокнот» — общее название для прог, превращающих звуки в буквы, и позволяющих значительно сократить время работы над текстом. Его использование значительно облегчит труд автора: большая часть работы будет сводиться к поиску и обработке материала будущего текста, а не к его набору. Давайте ознакомимся с возможностями программы для распознавания голосовых сообщений и протестируем ее на адекватность и полезность.

Знакомимся с голосовым блокнотом

Итак, чем же может нам помочь аудио блокнот? Разработчики утверждают, что он может выполнять такие функции, как:

  • создание голосовых заметок;
  • сохранение звуковых сообщений в локальном месте собственного устройства или же на облаке Гугл;
  • поддержка списка заменяемых слов;
  • расстановка знаков препинания.

Пользователь может использовать различные инструменты для расширения функций блокнота. К примеру, можно настроить ввод заглавных букв, упростить распознавание текста, делать откат ввода по специальной команде и многое другое. Общий смысл заключается в том, чтобы не только пользоваться аудио тетрадью, но и настроить его под собственный стиль речи. В этом случае конечное редактирование текста сведется к минимуму.

Перед установкой

Голосовой блокнот является бесплатным онлайн-сервисом, который предоставляется бесплатно в магазине Google. Данное приложение является расширением Chrome, поэтому работать оно будет лишь в этом браузере. Перед установкой ваш собственный Google Chrome необходимо обновить: расширение speechpad работает лишь в последних версиях данного браузера.

Также очень желательно иметь собственный аккаунт Гугл. Завести его очень просто, для этого потребуется лишь действующий почтовый ящик. Лучше всего подойдет почта gmail, которая также является разработкой Гугл. Но если вы категорически не настроены иметь почтовый ящик с расширением gmail.com, можно использовать другой. Когда все готово, можно приступать к скачиванию программы.

Установка голосового блокнота

Найденная страничка будет иметь такой вид:

После установки (пара секунд) в меню возможностей Гугл появляется вот такая иконка:

Вот это смешной смайлик с открытым ртом и является нашей программкой. После его нажатия открывается информационная страница с описанием возможностей голосового блокнота:

Внизу этой странички имеется поле для работы с блокнотом.

Чтобы начать работу с голосовым блокнотом следует проверить собственный микрофон и нажать вот эту кнопку:

В поле 1 будет транслироваться онлайн запись вашего голосового сообщения. После окончания записи текст будет перенесен в поле 2, где его можно будет отредактировать стандартными средствами Word.

Начало работы

Итак, приступаем. Жмем «Включить запись». При правильно работающем микрофоне она загорается оранжевым цветом:

После отключения записи текст появляется в нижнем поле, и будет иметь такой вид:

Запятые и точки следует проговаривать, их алгоритм программы распознает «на звук» и ставит там, где это необходимо автору. Наше сообщение получило свой знак препинания после того, как было сказано слово «точка».

Если присмотреться, можно увидеть, что фраза написана с ошибкой: так алгоритм распознал речевое сообщение. Исправить ошибку можно собственными средствами блокнота или же после переноса текста на лист Office Word.

Как можно видеть, блокнот передает речевое сообщение достаточно правильно. А чтобы сработаться с программой на «отлично», следует выполнять несколько простых рекомендаций:

  1. Не спешите и старайтесь медленно и четко выговорить каждое слово.
  2. Если в первом поле текст завис – не спешите диктовать дальше. аплгоритм собьется, и предложение нужно будет диктовать заново. Лучше остановиться и дать программе возможность вас догнать.
  3. Откорректируйте работу микрофона так, чтобы он не записывал посторонние звуки – и ваше дыхание в том числе.
  4. Для редактирования текста лучше всего использовать поле 2. делать это следует после успешной записи каждого предложения. Выключать запись не нужно, но и слишком долгие паузы делать не следует: затяжная тишина может выбить запись полностью. После редактирования предложения или абзаца включайте запись для дальнейшей диктовки текста. Второй вариант – начитать текст полностью, а затем редактировать его средствами Word. Конечно, каждый выбирает собственный стиль работы. Попробуйте оба и выберите свой.

Знаки препинания – это отдельная медаль разработчикам.

Если выговаривать их четко и размеренно, то программа не спеша расставит точки, запятые, двоеточия и восклицательные знаки по вашей команде.

Голосовой блокнот на мобильном устройстве

Кроме стандартного использования голосовой набор текста можно использовать в любом мобильном устройстве. Для этого следует активировать свою учетную запись в Гул и скачать приложение прямо в браузер Хром. После этого при запуске хром на мобильном устройстве Speechpad будет включаться по первому запросу.

Попробуйте сами это замечательный сервис и поделитесь своими впечатлениями в комментариях!