Речевые технологии разработка и программирование

Информация, разработка в области речевых технологий, программирование, библиотеки для разработчиков в области речевых технологий

Designing Effective Speech Interfaces

Susan Weinschenk, Dean T. Barker Designing Effective Speech Interfaces
Master the critical knowledge you need to design speech-enabled applications

It's not just a far-fetched gizmo straight out of a sci-fi movie anymore. Speech interface technology, which allows a user to communicate with computers via voice instead of a keyboard or a mouse, is quickly becoming a main feature in new software. This straightforward guide provides traditional graphical user-interface designers, developers, usability engineers, and product managers with all the information they need to make a rapid transition in order to stay abreast of this monumental shift in technology.

Речевые единицы устной русской речи

В монографии рассматриваются речевые единицы устной русской речи: их системность, зоны употребления, прагматическая направленность. Представлен многоаспектный анализ конструктивно-синтаксических единиц как основных единиц коммуникации: выявлены их интегральные и дифференциальные признаки, структурно-семантические и функционально-коммуникативные особенности, на основе чего дана новая классификация этих единиц. Определены закономерности функционирования речевых единиц в трех типах дискурса: разговорно-бытовом, массово-информационном и научном.

Речевое управление роботом

Книга посвящена проблемам управления техническими устройствами с помощью устной речи, что имеет непосредственное отношение к развитию робототехнических систем, управляемых голосом. Отражены различные аспекты лингвистической компоненты в подобного рода системах. Подчеркивается особое значение исследований в области фундаментального и прикладного речеведения, результаты которых напрямую связаны с вербальной составляющей ("слухом" и "речью") робототехнических систем, включающих автоматическое распознавание, понимание и синтез речевого сообщения.

MS Agent. Графические персонажи для интерфейсов

Рассмотрены технология Microsoft Agent и использование виртуальных персонажей в коммерческих приложениях, а также пользовательских проектах при программировании на языках JavaScript, VBScript, Visual Basic, C++, VB.NET и С#. Подробно описаны популярные виртуальные персонажи от профессиональных разработчиков Microsoft, La Cantoche, E-Clips, UK Software и др. Показано, как разрабатывать собственные персонажи и внедрять их в свои проекты.

MS Agent и Speech API в Delphi

Рассмотрено программирование нестандартных пользовательских интерфейсов в среде Delphi с применением технологий Microsoft Agent и Microsoft Speech API для операционных систем Windows 98/2000/XP. Представлены способы внедрения анимированных персонажей в приложения Delphi и использования методов синтеза и распознавания речи с помощью функций Speech API. Подробно рассмотрены речевые интерфейсы высокого и низкого уровней. Описан процесс создания собственных анимированных персонажей и использования нестандартной текстовой выноски Balloon Dialog.

Sakrament Speech Database

Sakrament SDB - база данных, созданная специально для задач распознавания и синтеза русской речи. В настоящее время база содержит более 40,000 реализаций русских слов, записанных разными дикторами. Слова были подобраны таким образом, чтобы фонетически полно представить модель русского языка. Кроме аудио данных, в базе содержится информация о фонетической сегментации слов для разных фонетических моделей.

Sakrament Software Development Kits

Компания в своих разработках ориентируется на новые наукоемкие технологии, которые делают общение человека с компьютером более дружественным и удобным. Все речевые технологии компании доступны разработчикам в виде специализированных пакетов - Software Development Kits (SDKs). Спектр SDK покрывает большинство существующих мобильных и настольных платформ, среди которых MS Windows, Linux, OS Symbian, MS PocketPC, MS Smartphone. Пакет разработчика включает файлы установки, программный интерфейс, документацию, примеры использования, а также дополнительные утилиты.

Sakrament Text-To-Speech SDK MS Windows Edition

Вы хотели бы не только разрабатывать телекоммуникационные приложения для вашей компании на основе технологии озвучивания русскоязычного текста (синтеза речи), но и встраивать речевые технологии в создаваемые вами программные продукты? Ваш выбор - это Sakrament Text-To-Speech SDK MS Windows Edition v. 3.0 (Russian Version), предназначенный для крупных компаний с серьезными запросами в области телекоммуникаций, а также для разработчиков TTS-продуктов.

ОПЫТ РАЗРАБОТКИ РЕЧЕВОЙ ЭЛЕКТРОННОЙ ПОЧТЫ С ИСПОЛЬЗОВАНИЕМ MICROSOFT SPEECH SD

Для людей, страдающих дефицитом общения, компьютер все чаще становится единственной отдушиной, единственной калиткой в мир. Особенно это важно для людей, самой природой ограниченных в общении. Системы распознавания английской речи и произношения текстов, получившие в последнее время большую популярность в Америке и Европе, - важное дополнительное средство общения и источник информации об окружающем мире. С их помощью пользователь может общаться с людьми в любой точке мира, его голос будет воспроизведен с высоким качеством. Причем тариф на этот вид связи существенно ниже, чем стоимость международных телефонных переговоров.

Инструменты для разработчика

В дополнение к программам диктования Dragon Systems и IBM предлагают инструменты для разработчиков, желающих усилить мощность своих программ. Dragon предлагает DragonDictate, дискретный механизм распознавания языка, а IBM набор инструментов ViaVoice Developer Tools.

Страницы