Речевые базы - speech-engine

Голосовые движки - речевые базы и библиотеки для синтеза речи и преобразования текста в речь.

Синтезаторы речи для Android

Для ОС Android выпущено много синтезаторов речи, однако поддержка русского языка обеспечена далеко не у всех. Основная проблема – многоязычные тексты, с которыми некоторым голосовым движкам трудно справиться. Рассмотрим основные TTS системы.

Acapela TTS Voices

Один из самых популярных мультиязычных синтезаторов речи от Acapela Group доступен и для Android. Для синтезированных голосов характерно высокое качество речи и хорошая стабильность работы.

Синтезаторы русской речи

Для преобразования текста в речь необходимо установить на компьютер синтезатор речи. Синтезаторы речи - это программные библиотеки (text-to-speech engine), которые  позволяют другим программам читать текст голосом. Синтезаторы речи отличаются качеством воспроизводимой речи,  возможностью изменять настройки речи и могут содержать несколько голосов, в том числе женские и мужсие голоса.

СВОБОДНЫЕ РЕЧЕВЫЕ БАЗЫ ДАННЫХ VOXFORGE.ORG

В связи с развитием устройств хранения и коммуникации современное оборудование позволяет накапливать и обрабатывать огромные массивы данных. Базы речи применяются при построении систем синтеза и распознавания речи, для оценки различных методик при тестировании приложений. Большинство современных баз собрано вручную, значительные ресурсы затрачены на их создание. Остро стоит вопрос автоматизации процесса сбора и обработки данных, вовлечения носителей языка в процесс записи.

РЕЧЕВЫЕ БАЗЫ ДАННЫХ

Речевые (акустические) базы данных являются основой при разработке систем синтеза речи и распознавания голоса. В основе лежит принцип деления речи на дискретные единицы. Существуют единицы разной размерности - аллофоны, дифоны, трифоны, слоги, полуслоги и т.д. В зависимости от выбранных единиц, создаются различные по типу речевые базы.

Сектор автоматического распознавания и цифровой обработки речевых сигналов

Сектор автоматического распознавания и цифровой обработки речевых сигналов (до 1987 г - автоматического распознавания речи) был образован в Вычислительном центре АН СССР в 1978 году.

Разработана акустико-фонетическая и речевая базы данных. База данных включет в себя речевой материал для проведения исследований в области речевых технологий, в частности, для создания систем обработки речи в области телекоммуникаций.

Стэл - Компьютерные Системы

Речевая база данных компании "Стэл - Компьютерные Системы"
Собранная база данных объединяет несколько составных частей, отличающихся типом читаемого текста и соответствующим транскрипционным материалом.

Московский Государственный институт Электроники и Автоматики

На кафедре ЭВА была создана речевая база данных небольшого объема силами коллектива, занимающегося речевыми исследованиями в целях исследования и дальнейшир разработок в области речевых технологий.

Лингвистические базы компании Ectaco, Inc.

Используются в собственных разработках компании. При создании своих лингвистических баз были привлечены профессиональные лингвисты, уровень знаний языка которых близок к нативному. Это позволило создать максимально полные и современные базы для более чем 50 языков. В своей работе специалисты Ectaco, Inc. используют различные лингвистические источники, что делает базы максимально полными и современными.

Лингвистические базы содержат как сами слова, так и разговорные выражения и сленг.

Двуязычные словарные базы

КОМПАНИЯ "AUDITECH"

SpeechDat(II) и SpeechDat(E)

В реализации проекта SpeechDat(II) компания участвовала в качестве субконтрактора концерна "Сименс", и проекта SpeechDat(E) - в качестве самостоятельного партнера наряду с научно-исследовательскими и коммерческими организациями ряда европейских стран (Франции, Германии, Польши, Чехии и т.д.).

Речевой корпус русского языка RuSpeech

Разработчик: компания Cognitive Technologies по заказу Intel

Является результатом инвестиционного проекта по созданию систем распознавания русской речи. В результате реализации проекта впервые в России создан обширный инструментарий для разработки систем распознавания речи, который включает крупный речевой корпус русского языка RuSpeech, достаточный для распознавания естественной речи говорящего в реальном времени.