Речевые технологий

Голосовое управление ассистент Дуся на Android

Ассистент Дуся это голосовой ассистент для вашего устройства на Android-е, который помогает выполнять многие повседневные задачи без прикосновения к экрану, а только за счет вашей речи, а так же возможность быстро скачивать новые функции, придумывать и создавать свои, и делиться ими с другими пользователями!

Эта программа позволяет свести практически на минимум «общение» с экраном мобильного устройства, поскольку все действия выполняются только с помощью голоса. К тому же, программа максимально функциональная и сговорчивая, подобнее обо всем этом далее.

Русские голосовые движки и применение Google Api TTS

Много копий поломано в спорах относительно голосовых движков. Одно несомненно, будущее у них есть и будущее большое, от собственно озвучивания текстов до голосового управления смартфонами и персональными компьютерами. Тем не менее, несовершенство представленных на сегодняшний день голосовых движков бросается в глаза. Связано это в первую очередь со сложностью русского языка и нежеланием вкладывать колоссальные средства в разработки.

Синтез речи

Существуют различные методы синтеза речи. Выбор того или иного метода определяется различными ограничениями. Рассмотрим те 4 вида ограничений, которые влияют на выбор метода синтеза.

Синтезатор речи Nefonit для OS Android

Стала доступна портированная под Android версия синтезатора Фонемафон, также известного как Newfon. В варианте для системы Android данный голосовой движок называется Nefonit TTS. Среди преимуществ этого синтезатора речи разработчик называет быстрый отклик, расширенные настройки и компактность.

Nefonit TTS обладает следующими возможностями:

Компьютерные технологии для незрячих и слабовидящих

«Тифлокомп» - портал «Компьютерные технологии для незрячих и слабовидящих». Здесь представлены различные по объему, уровню сложности и способу изложения публикации, связанные общей тематикой: какие современные технические средства могут помочь незрячим и слабовидящим и что следует делать, чтобы техника и программы работали так, как нужно пользователю. Наши материалы прежде всего рассказывают о программных и аппаратных средствах, благодаря которым незрячий и слабовидящий пользователь может через речевой или тактильный интерфейс получить доступ к большинству популярных приложений персонального компьютера и применять их в своей повседневной деятельности.

Онлайн сервис Radio RSS

Друзья, сегодня хочу познакомить Вас с очень необычным онлайн сервисом Radio RSS. Он был создан  компанией «Центр речевых технологий» (ЦРТ), которая является одним из лидеров в сфере обработки и анализа аудио-видео информации, а также синтеза и распознавания речи.

Обновление мобильного приложения «Читатель»

Центр речевых технологий выпустил новую версию своего мобильного приложения для iOS «Читатель», которое читает вслух любые загруженные в устройство книги и документы. Делает он это с помощью технологии синтеза речи, разработанной в ЦРТ. Владельцы iPhone и iPad могут оценить новый дизайн, улучшения по эргономике и навигации, возможность работать со шрифтом, а также новые голоса (2 мужских и 2 женских), которые теперь можно загружать дополнительно.

Голосовое управление компьютером

Как управлять компьютером голосом? Для голосового управления компьютером необходимо на компьютер установить дополнительную программу.

Начнем с бесплатного софта, который позволяет управлять компьютером с помощью русской речи. Можно будет уговорить его открывать программы, выполнять какие-то действия и так далее. И ваши руки будут свободны для более важных дел.

Программа голосового управления Typle

Синтез речи в Android-приложении

Text-to-Speech (TTS) можно использовать двумя способами. Во-первых, можно завязываться на конкретный движок, покупать библиотеку и работать через неё. Про этот вариант ничего не могу сказать, знаю только теоретически. Второй, общеизвестный вариант — использовать стандартное API. Голоса в этом случае являются просто приложениями, установленными в системе.

Вообще-то заставить приложение говорить не так сложно, и мануалов по этому поводу полно. Но для полноты картины приведу начальные сведения.

Начиная с версии 1.6 в SDK есть стандартный класс TextToSpeech.

Страницы