Речевые технологий

Информация и статьи о речевых технологиях.
Программы синтеза речи и распознавания голоса

Можно ли разговаривать с компьютером?

Технологии машинного распознавания человеческой речи развиваются уже на протяжении нескольких десятилетий (см. "Компьютер учится говорить (и слушать тоже!)", CW. 1998. ь 20). За это время аналитики не раз предсказывали голосовым технологиям блестящее будущее, но широкое внедрение каждый раз откладывалось. Сегодня, с появлением недорогих продуктов для распознавания слитной речи, созданных в IBM (ViaVoice) и Dragon Systems (Dragon NaturallySpeaking), снова зазвучали оптимистические прогнозы. И на этот раз для них есть достаточно серьезные основания.

Видеть

Некоторые материалы темы ( #335 от 22 февраля 2000 года), посвященной компьютерным технологиям для инвалидов, стимулировали весьма позитивные процессы. Так, автор одной из статей темы, слепоглухонемой доктор психологических наук Александр Суворов теперь имеет выход в Интернет благодаря поддержке, которую ему оказал () и отчасти РООИ (rooisszi@online.ru). Мы получили также ряд интересных писем.

Услышь меня, машина

Что такое распознавание речи? На первый взгляд, все очень просто: вы произносите фразу, на которую техническая система реагирует адекватно - либо автомат выполняет команду, содержащуюся во фразе, либо набирает диктуемый текст, либо распоряжается извлеченной из фразы информацией иным образом. Как именно, зависит от конкретной реализации.

Системы понимания естественного языка

Процесс общения с машиной долгое время оставался уделом специалистов и был недоступен для понимания простым смертным. Тем самым "простым смертным", которые, собственно говоря, и являлись потребителями компьютерных услуг.Технологи зачастую самой ЭВМ и в глаза-то не видели, а общались с машиной через посредника-программиста".

SPEECH-ENGINE - ДВИЖОК СИНТЕЗА РЕЧИ

Движок - это набор программных средств выполняющих строго определенную задачу и предоставляющий интерфейс для использования его возможностей.
В настоящее время существует целый ряд движков синтеза и распознавания речи, которые разработаны для использования совместно с MS Speech API. На этой странице представлены некоторые их них.

Обзор компьютерных программных решений распознавания и синтеза речи

Все современные продукты обработки речи базируются на двух независимых технологиях: технологии распознавания и технологии синтеза речи. Первая обеспечивает ввод речевой информации в компьютер, вторая - его вывод. Если при воспроизведении речи на сегодня удалось достичь высокого качества программных решений при их низкой ресурсоёмкости, то качество программных решений распознавания речи (при их большой ресурсоёмкости) остаётся всё ещё очень невысоким.

Речевые технологии - лекция

Писать о речевом интерфейсе сложно. С одной стороны, тема абсолютно не нова, с другой- активное развитие и применение этой технологии только начинается в который раз. С одной стороны, успели сформироваться устойчивые стереотипы и предубеждения, с другой - несмотря на почти полвека настойчивых усилий не нашли разрешения вопросы, стоявшие еще перед родоначальниками речевого ввода.Как бы то ни было, продолжатся поиски такого интерфейса, который устроил бы всех. Собственно говоря, это как раз то, к чему человечество всегда стремилось в общении с компьютером.

Страницы