RealSpeaker

Приложение аудиовидео распознавания речи RealSpeaker использует дополнительную видео информацию, которое позволяет  улучшать качество распознавания речи более чем на 20-30%.

Проект RealSpeaker заявлен для потенциальных инвесторов как видеорасширение для увеличения точности программ аудиораспознавания речи за счет дополнительной обработки движения губ пользователя. Иначе говоря, помимо обработки звука программа «читает» по губам пользователя, что, по заявлению разработчиков, позволяет улучшить технологию трансформации речи в текст до 20% по сравнению с алгоритмами Dragon NaturallySpeaking (в версии для Mac OS — Dragon Dictate). Учитывая, что за прошедшие годы Dragon пережил 12 версий, оставаясь лидером среди программ по переводу речи (прежде всего английской) в текст,RealSpeaker выступает в роли Давида в поединке с Голиафом. 

Разработчики заявляют об интеграции своего продукта в Google Voice Search и поддержке семи языков: русского, английского (американского и британского диалектов), французского, немецкого, китайского, корейского и японского. - сейчас одиннадцать: турецкий, испанский, итальянский, украинский)

По словам генерального директора ООО «РеалСпикер Лаб» Виктора Осетрова, помимо рабочей десктоп-версии под Windows 7 и 8 началась разработка Android-приложения. Кроме того, утверждает он, тестирование видеофильтра RealSpeakerвывело его детище в лидеры по точности распознавания речи среди подробных программ, поэтому в планах компании привлечь стратегического инвестора, способного вывести готовый продукт на международный рынок.

«Скачай бесплатно RealSpeaker, и ты сможешь вводить текст любой длины с помощью голоса в любой текстовый редактор (блокнот, MS Word, Skype, VKontakte, Facebook и т.д.) на любом из одиннадцати языков», — указано на сайте проекта. При этом системные требования RealSpeaker заявлены вполне демократичные: компьютер с фронтальной камерой и микрофоном, наличие доступа в интернет, ОС Windows 7 или 8. 

Инсталляция на десктоп с установленной веб-камеройLogitech Webcam 200оказалась довольной легкой и заняла всего пару минут. В качестве аудиоустройства выступала гарнитура SVEN AP600 — вполне средняя система. УстановкаRealSpeaker на ноутбукLenovo G780 также прошла без шероховатостей.

Выставление нужных параметров распознавания текста сводится, по сути, к двум кликам: выбору языка и микрофона — и в окошке программы появляется «Старт». Зеленый цвет окошка и пара рамок, очерчивающих голову и губы пользователя, cвидетельствуют об успешном начале работы видеофильтра.

А вот подстройка под работу приложения таит в себе массу неожиданностей: голову приходится держать ровно — поворот более чем на 3/4 приводит к потере программой лица пользователя. Оптимальное размещение головы диктующего — центр рабочего окна программы, на расстоянии около 40 см от дисплея. Всё бы ничего, но в случае чтения с листа процесс взаимодействия с программой значительно усложняется.

Итог нескольких часов тестирования не столь однозначен. RealSpeaker безошибочно обрабатывает около 2/3 произнесенных слов. При этом практически не реагирует на союзы, иногда «сглатывает» целые куски фраз (при равномерном надиктовывании) и категорически отказывается понимать некоторые слова — например, «кот» так и не дался программе. Субъективно чуть лучше  программа работает с английским и немецким языками. Впрочем, эта странность объясняется довольно просто: словарная база русского языка в отличие от распространенных европейских развита средне, и в следующих версиях RealSpeaker — есть надежда — картина изменится к лучшему.

Официальный сайт http://www.realspeaker.net/ru/
Ссылка на Торенте http://rutracker.org/forum/viewtopic.php?t=4809091

 

Голосование: 
0
Голосов пока нет