Распознавание речи

Информация о распознавании речи. Распознавание речи и голоса на компьютере. Программы распознавания голоса

Распознавание слитной речи на примере IVR систем

Но для начала попробуем разобраться в том, что же такое речевые технологии вообще и какими они могут быть.

Google Chrome научился распознавать речь

Новая версия браузера Google Chrome дополнена функцией распознавания человеческой речи. Система умеет переводить устную речь в печатный текст. Это дает возможность, к примеру, надиктовать письмо для отправки по электронной почте, не пользуясь клавиатурой.

Распознавание речи от Яндекса.

Команды голосом — самый, казалось бы, очевидный и неизбежный в скором будущем способ управлять компьютером. Веру в то, что тачскрин, мышку и клавиатуру скоро заменит универсальный речевой интерфейс, уже лет сорок подпитывает кинематограф, начиная с кубриковской «Одиссеи», где главный злодей HAL 9000 представлен преимущественно анестезирующе вежливым голосом, и заканчивая многословным романом Хоакина Феникса с операционной системой в фильме «Она». На то же намекают десятки вышедших за последние годы мобильных голосовых помощников у Apple, Google, Microsoft и проч.

автоматический секретарь с распознаванием речи

Компания CTI выпустила инновационное решение - CTI Speech Attendant, для организации автоматизированного секретаря на основе технологий распознавания и синтеза речи. CTI Speech Attendant предоставляет телефонной системе сценарий соединения абонентов с сотрудниками, а используемые в решении технологии позволяют автоматически распознавать произнесенные абонентом фамилию, имя, название должности или подразделения. Таким образом, звонящие в компанию клиенты, легко и быстро дозваниваются до нужного сотрудника.

Распознавание речи в телефонии

Технология распознавания речи позволяет строить приложения телефонных услуг, в которых абонент осуществляет выбор в меню не тональным набором, а произнося голосовые команды. Система стала привлекательнее для абонента за счет более дружественного и естественного интерфейса.

Технология идентификация личности по произвольной слитной речи.

В современном мире все больше проявляется интерес к речевым технологиям, в частности, к идентификации личности по голосу. Это объясняется, с одной стороны, появлением высоко производительных вычислительных систем на базе ПК и аппаратных средств позволяющих производить ввод сигнала в ПК, а, с другой стороны, высокой потребностью систем аутентификации в разных областях жизнедеятельности человека.

К настоящему моменту за рубежом и у нас реализованы системы автоматической идентификации по голосу. Большинство этих систем строятся по единой концептуальной схеме:

Распознавание речи в операционных системах

Возможность управлять операционной системой с опмошью голоса - это уже не фантастика. Еще десять лет назад появилось новаторское решение для Macintosh - ПО PlainTalk - но к сожалению оно не получило, дальнейшего развития. Сегодня технология, подобная PlainTalk, используется в Windows: разработаны четыре программы, позволяющие не только запускать приложения, давая устную команду компьютеру, но и диктовать текст так быстро, как только допускают физические возможности человека.

ТЕСТИРОВАНИЕ ПРОГРАММ РАСПОЗНАВАНИЯ РЕЧИ

В обзоре представлены такие программы, как IBM ViaVoice Gold, Philips FreeSpeech 2000, L&H Voice Xpress Pro, Dragon NaturallySpeaking Preferred и "Горыныч Проф 1.0".

Все пять пакетов рассчитаны в первую очередь на то, чтобы обеспечить ввод в документ текста. Первые четыре позволяют вводить английскую речь, и только последний русскую.

Использование речевых технологий

Система распознавания и документирования речевых выступлений, разработанная питерским Центром речевых технологий, внедрена в аппарате правительства РФ, Госдуме и Совете Федерации. Теперь устные выступления чиновников и депутатов будут автоматически преобразовываться в текстовые файлы, и уже через 5-7 минут после завершения заседания можно будет пользоваться полным текстом стенограмм выступлений.

Страницы