Vocative Russian ASR Engine

Программный комплекс распознавания русской речи.
Назначение и области использования

Vocative Russian ASR Engine специально предназначен для распознавания произвольного набора слов и фраз с заранее определенным набором возможных контекстов в телекоммуникационных приложениях:

* Навигация по информационно-развлекательным IVR-меню (информация о счете, заказ билетов, гороскопы, результаты матчей и т.п)
* Служба автоматического секретаря (связь с нужным человеком по его имени)

В настояший момент компания Vocative сконцентрировала усилия на подготовке лучшей технологии распознавания русской речи для использования в многопользовательских приложениях в телекоммуникационном сегменте рынка. Однако мы также рассматриваем возможность подготовки отдельных продуктов для однопользовательских мультимедийных и аппаратных платформ (системы голосового управления персональным компьютером, системы электронного перевода, управления функциями мобильного обрудования – КПК, мобильные телефоны, системы автомобильной навигации).

Основные характеристики технологии:

* Дикторонезависимость
* Шумоустойчивость
* Неограниченный словарь
* Алгоритмы выделения речи из звукового потока (Voice Activity Detection)
* Лингвистические алгоритмы, учитывающие особенности русского языка: фонетика, морфология, правила произношения, вариативность

Основные технические характеристики Vocative Russian ASR Engine:

* Поддерживаемые платформы: Windows 2000, Windows XP
* API: MRCP
* Язык разработки: C++
* Формат звукового сигнала: 8 kHz

Дополнительно:

* Документация

В настоящий момент производится разработка, тестирование и отладка программных компонентов Vocative Russian ASR Engine. Происходит оптимизация акустических признаков и параметров акустической модели.

Коммерческий продукт планируется выпустить на рынок в 2007-ом году.

Создавая лучшую технологию распознавания русской речи, мы используем:

* Акустические модели, основанные на Скрытых Марковских Цепях
* Специализированные звуковые базы данных для обучения надежных акустических моделей
* Тестовые базы данных, моделирующие реальные примеры использования технологии распознавания речи в коммерческих сервисах
* Словарь русского языка, содержащий информацию о фонетическом составе и грамматических признаках более 3 млн. слов русского языка, в том числе имена и названия городов
* Динамическое транскрипционное моделирование, основанное на правилах русского произношения, позволяющее получить транскрипцию любого слова
* Открытые стандарты, поддержка которых обеспечивает совместимость с наиболее распространенными мультимедийными платформами (в частности, VXML-платформами), что в свою очередь обеспечивает сокращение затрат на создание, внедрение и поддержку коммерческих продуктов и сервисов, основанных на технологии распознавания русской речи

http://www.vocative.ru

Голосование: 
0
Голосов пока нет