Сектор автоматического распознавания и цифровой обработки речевых сигналов

Сектор автоматического распознавания и цифровой обработки речевых сигналов (до 1987 г - автоматического распознавания речи) был образован в Вычислительном центре АН СССР в 1978 году.

Разработана акустико-фонетическая и речевая базы данных. База данных включет в себя речевой материал для проведения исследований в области речевых технологий, в частности, для создания систем обработки речи в области телекоммуникаций.

Основная цель проекта состояла в сборе и обработке (аннотировании) речевого сигнала в обьеме, достаточном для обучения статистических моделей звуков, которые затем могут быть использованиы, например, при создании прототипов коммерческих систем распознавания речи, проведения статистических исследований (сравнительные исследования речи, записанной в телефонном канале и с микрофона, методов адаптации к каналу передачи, дикторам, алгоритмов фильтации от шумов и т.п.) на контролируемом речевом материале.

Акустико-фонетическая часть базы данных состоит из 45-минутных речевых тестов, записанных 10 дикторами и отсегментированных на участки фонем вручную. Все записи - двухканальные (телефон + микрофон). Речевая часть базы данных состоит из записей специальных тестов от 100 дикторов. Тесты состоят из читаемого и разговорного материала, и в частности, включают цифры, числа, номера, имена, даты и фонетически насыщенные фразы.

Материал аннотирован, в частности, содержит орфографическую запись и фонетическую маркировку. Большая часть данных записана в двухканальном варианте (телефон+ микрофон)..
О фирме
http://www.cs.ru/depart/chuchu/doc_ru/projects/phondb.htm
e-mail:chuchu@ccas.ru

Голосовать: 
0
Голосов пока нет