Речевые технологии
Распознавание голоса
Синтез речи
Информация / Новости
MP3 библиотека

Форум - речевые технологии

Форум речевые технологии
обсуждение вопросов связанных с речевыми технологиями.
Информация, новости, события, разработки.
Актуальные темы и вопросы.
Синтез и распознавание речи на языке эсперанто.

ПоискПоиск   Участники   Регистрация   Вход

   Форум - речевые технологии -> Общие темы о речевых технологиях -> Синтез и распознавание речи на языке эсперанто.
Автор Сообщение

Hemulo

участник форума


Профиль Hemulo Отправить личное сообщение для Hemulo
К сожалению, я мало знаком с технологиями синтеза и распознавания речи, собственно в поисках какой-то информации я и набрёл на ваш форум (не очень активный к сожалению).

Но в общих чертах я давно интересовался этой тематикой (с практической точки зрения). Могу сказать, что ещё лет десять назад я считал, что эффективные средства распознавания и синтеза речи это задачи которые будут успешно реализованы в самое ближайшее время. Увы. До сих пор я не видел никаких решений, которые были бы самодостаточны и могли бы быть реально применимы без каких либо косяков.

Как мне кажется, основная проблема мешающая эффективной реализации компьютерного синтеза и распознавания речи кроется в том, что большинство проектов (и соответственно финансов) нацелено на работу с английским языком. Английский язык, сам по себе чрезвычайно сложен, а в области фонетики он вообще один из самых кривых языков. Поэтому многие миллионы долларов, которые выделялись различными фирмами на решение этих проблем просто пускались на ветер.

Русский язык, тоже является довольно сложным и тоже с трудом поддаётся компьютерной обработке.

Фактически, для нормальной и полноценной реализации синтеза и распознавания речи на таких языках как английский и русский необходимо включать в программу модуль семантического анализа текста. (Компьютерный семантический анализ, это та тема, с которой была связана моя дипломная работа. Поэтому вопрос я представляю изнутри.)

В ближайшее время, полноценный семантический анализ, вряд ли будет реализован, т.к. с ним связана масса сложностей и работают над этим вопросом слишком маленькое количество людей.

ОДНАКО! Если подойти к вопросу синтеза и распознавания речи с другой стороны, то мы увидим, что программы эффективного и полноценного распознавания речи например для такого искусственного языка как Loglan существуют где-то с 60х-70х годов 20 века.

Фишка в том, что сам язык Loglan (и его полный аналог Lojban) создавался специально с целью максимальной адаптации человеческой речи со строгой машинной логикой.

Должен сказать, что с языковым проектом Loglan я не знаком близко, но знаю, что он всё-же так и не стал полноценным языком.

Совсем другое дело обстоит с плановым языком эсперанто (Esperanto), который был создан ещё в 1887 году и с тех пор является живым постоянно функционирующим языком. Т.е. начиная с 1887 года на нём разговаривают реальные люди, пишут оригинальные произведения и занимаются переводами. Сейчас этот язык распространён и в интернете. Общее количество эсперантоговорящих посчитать трудно, по разным оценкам количество людей активно владеющих языком эсперанто определяют от сотен тысяч, до миллионов людей во всём мире.

К слову, «Mi perfekte scipovas la lingvon» (я прекрасно владею этим языком).

Фишка эсперанто в том, что это совершенно нормальный язык, созданный для человеческого общения, но этот язык имеет плановую грамматику и не содержит исключений.

Такая структура грамматики была сознательно введена для того, чтобы максимально облегчить изучение языка. Например, в эсперанто отсутствуют спряжения глаголов, существуют всего два падежа и применяется агглютинативная система словообразования (корни не меняют свою форму, как в русском языке: «лёг»-«лежал»).

Кроме того, одними из важнейших принципов эсперанто в области фонетики являются:

1) фиксированное ударение на предпоследнем слоге.
2) строгое соответствие букв и звуков (каждой букве соответствует один звук и наоборот).

Именно благодаря всем этим структурным особенностям эсперанто является наверное идеальным языком для синтеза и распознания речи среди всех существующих сейчас живых языков.

Эти теоретические рассуждения подтверждаются тем, что из всех виденных мною программ синтеза речи применяемых для чтения реальных текстов единственно эффективной была программа читающая на эсперанто. (программы для чтения русскоязычных текстов всегда косячат с ударениями)

В той эсперантоязычной программе синтеза речи я заметил только один недостаток, связанный с произношением цифр. Когда цифры (например 3) были написаны словами (на эсперанто 3 = «tri») они по буквам произносились правильно, но когда это же число было написано цифрой «3» то произношение (видимо слово зачитывалось целиком) было ужасным, скорее напоминавшим английское «three» (видимо тот кто начитывал звуки был англоговорящим и отдельные звуки он начитал хорошо, а с их связками при произнесении целых слов накосячил).

И это было единственным недостатком эсперантоязычной программы.
Сообщение # 1. Отправлено: 19.06.2009 - 12:20:16
Страницы:  1  
Администратор запретил отвечать гостям на сообщения! Для регистрации пройдите по ссылке: зарегистрироваться


art-студия

Powered by WR-Forum © 1.8