Речевые технологии разработка и программирование

Информация, разработка в области речевых технологий, программирование, библиотеки для разработчиков в области речевых технологий

MS Agent и Speech API в Delphi

Рассмотрено программирование нестандартных пользовательских интерфейсов в среде Delphi с применением технологий Microsoft Agent и Microsoft Speech API для операционных систем Windows 98/2000/XP. Представлены способы внедрения анимированных персонажей в приложения Delphi и использования методов синтеза и распознавания речи с помощью функций Speech API. Подробно рассмотрены речевые интерфейсы высокого и низкого уровней. Описан процесс создания собственных анимированных персонажей и использования нестандартной текстовой выноски Balloon Dialog.

Sakrament Speech Database

Sakrament SDB - база данных, созданная специально для задач распознавания и синтеза русской речи. В настоящее время база содержит более 40,000 реализаций русских слов, записанных разными дикторами. Слова были подобраны таким образом, чтобы фонетически полно представить модель русского языка. Кроме аудио данных, в базе содержится информация о фонетической сегментации слов для разных фонетических моделей.

Sakrament Software Development Kits

Компания в своих разработках ориентируется на новые наукоемкие технологии, которые делают общение человека с компьютером более дружественным и удобным. Все речевые технологии компании доступны разработчикам в виде специализированных пакетов - Software Development Kits (SDKs). Спектр SDK покрывает большинство существующих мобильных и настольных платформ, среди которых MS Windows, Linux, OS Symbian, MS PocketPC, MS Smartphone. Пакет разработчика включает файлы установки, программный интерфейс, документацию, примеры использования, а также дополнительные утилиты.

Sakrament Text-To-Speech SDK MS Windows Edition

Вы хотели бы не только разрабатывать телекоммуникационные приложения для вашей компании на основе технологии озвучивания русскоязычного текста (синтеза речи), но и встраивать речевые технологии в создаваемые вами программные продукты? Ваш выбор - это Sakrament Text-To-Speech SDK MS Windows Edition v. 3.0 (Russian Version), предназначенный для крупных компаний с серьезными запросами в области телекоммуникаций, а также для разработчиков TTS-продуктов.

ОПЫТ РАЗРАБОТКИ РЕЧЕВОЙ ЭЛЕКТРОННОЙ ПОЧТЫ С ИСПОЛЬЗОВАНИЕМ MICROSOFT SPEECH SD

Для людей, страдающих дефицитом общения, компьютер все чаще становится единственной отдушиной, единственной калиткой в мир. Особенно это важно для людей, самой природой ограниченных в общении. Системы распознавания английской речи и произношения текстов, получившие в последнее время большую популярность в Америке и Европе, - важное дополнительное средство общения и источник информации об окружающем мире. С их помощью пользователь может общаться с людьми в любой точке мира, его голос будет воспроизведен с высоким качеством. Причем тариф на этот вид связи существенно ниже, чем стоимость международных телефонных переговоров.

Инструменты для разработчика

В дополнение к программам диктования Dragon Systems и IBM предлагают инструменты для разработчиков, желающих усилить мощность своих программ. Dragon предлагает DragonDictate, дискретный механизм распознавания языка, а IBM набор инструментов ViaVoice Developer Tools.

Распознавание русской речи

Вот и пришло время, когда у нас по-настоящему появилась возможность управлять компьютером или иными системами с помощью голоса, русским языком. Здесь мы говорим не о простой записи звукового фрагмента с последующим сравнением содержимого с заранее подготовленными шаблонами, а о полноценном распознавании речи, преобразовании голосовых фраз, сказанных любым человеком, в текст, который потом можно анализировать на предмет содержащихся в нем команд автоматизированной системе.

Инструментарий разработчика "Говорящая Мышь"

Инструментарий "Говорящая Мышь" (ГМ\И) позволяет встраивать синтез речи на русском языке в приложения, разрабатываемые для работы в среде Windows 95/98, NT. ГМ\И работает со звуковой картой, используя стандартные драйверы для Windows, и представляет собой набор динамических библиотек и примеров их использования. По желанию клиента По желанию клиента ему может быть предоставлено право доступа к исходным текстам на языке С (без права передачи исходных текстов третьим сторонам или лицам). Стандартный метод применения ГМ\И состоит в том, что приложение пересылает инструментарию слово либо предложение, подлежащее произнесению, и ГМ\И организует произнесение слова или фразы с помощью звуковой карты или создавая звуковой файл в предписанной области памяти или на диске.

Страницы