Голосовые движки

Голосовые движки text-to-speech engine

Речевой корпус русского языка RuSpeech

Разработчик: компания Cognitive Technologies по заказу Intel

Является результатом инвестиционного проекта по созданию систем распознавания русской речи. В результате реализации проекта впервые в России создан обширный инструментарий для разработки систем распознавания речи, который включает крупный речевой корпус русского языка RuSpeech, достаточный для распознавания естественной речи говорящего в реальном времени.

КОМПАНИЯ "AUDITECH"

SpeechDat(II) и SpeechDat(E)

В реализации проекта SpeechDat(II) компания участвовала в качестве субконтрактора концерна "Сименс", и проекта SpeechDat(E) - в качестве самостоятельного партнера наряду с научно-исследовательскими и коммерческими организациями ряда европейских стран (Франции, Германии, Польши, Чехии и т.д.).

Лингвистические базы компании Ectaco, Inc.

Используются в собственных разработках компании. При создании своих лингвистических баз были привлечены профессиональные лингвисты, уровень знаний языка которых близок к нативному. Это позволило создать максимально полные и современные базы для более чем 50 языков. В своей работе специалисты Ectaco, Inc. используют различные лингвистические источники, что делает базы максимально полными и современными.

Лингвистические базы содержат как сами слова, так и разговорные выражения и сленг.

Двуязычные словарные базы

Московский Государственный институт Электроники и Автоматики

На кафедре ЭВА была создана речевая база данных небольшого объема силами коллектива, занимающегося речевыми исследованиями в целях исследования и дальнейшир разработок в области речевых технологий.

Стэл - Компьютерные Системы

Речевая база данных компании "Стэл - Компьютерные Системы"
Собранная база данных объединяет несколько составных частей, отличающихся типом читаемого текста и соответствующим транскрипционным материалом.

Сектор автоматического распознавания и цифровой обработки речевых сигналов

Сектор автоматического распознавания и цифровой обработки речевых сигналов (до 1987 г - автоматического распознавания речи) был образован в Вычислительном центре АН СССР в 1978 году.

Разработана акустико-фонетическая и речевая базы данных. База данных включет в себя речевой материал для проведения исследований в области речевых технологий, в частности, для создания систем обработки речи в области телекоммуникаций.

РЕЧЕВЫЕ БАЗЫ ДАННЫХ

Речевые (акустические) базы данных являются основой при разработке систем синтеза речи и распознавания голоса. В основе лежит принцип деления речи на дискретные единицы. Существуют единицы разной размерности - аллофоны, дифоны, трифоны, слоги, полуслоги и т.д. В зависимости от выбранных единиц, создаются различные по типу речевые базы.

Digalo Dit It

Настоящим прорывом в технологии синтеза речи (text-to-speech) стало появление третьей версии условно-бесплатного голосового движка синтеза русской речи Digalo французской фирмы Elan Informatique. Русский мужской голос французского движка получил кодовое название Nikolai.

Lernout Hauspie (L&H)

Lernout Hauspie (L&H) - лидер среди фирм, занимающимися исследованиями и разработками в области речевых технологий. Выпущенный ими движок синтеза русской речи, благодаря поддержке ASR1600 и TTS3000 SAPI 5.0 SDKs используется во многих программных продуктах в различных областях.

Движок L&H имеет два голоса: первый женский - Adult Female; второй мужской Adult Мale.

Sakrament

Cистема синтеза русской речи "SAKRAMENT TEXT-TO-SPEECH ENGINE" создана на основе собственных разработок компании "Сакрамент" с использованием более чем 30 летнего опыта ведущих специалистов в этой области. Применение уникальных алгоритмов и разработка собственной акустической базы позволили добиться существенного повышения качества синтезируемой речи, а разработка интуитивно-простого интерфейса системы дополнила органичность самого синтеза, и сделала его наиболее привлекательным для пользователей.

Страницы