Управление голосом

Информация о технологиях управления голосом

Поговори со мной на QWERTY

За годы практики я научился быстро печатать двумя пальцами; ни малейших признаков туннельного синдрома запястья у меня пока нет. Но по просьбе нашего редактора я отставил клавиатуру в сторону и две недели гулял по электронным таблицам и Web, а также писал письма с помощью пакета NaturallySpeaking компании Dragon Systems. Даже в данный момент я медленно, но почти верно диктую эту статью в Word.

Голосовой серфинг в Интернете

По мере того как технологии распознавания речи прибавляют в точности и удобстве использования, все более реальным становится обещание корпорации Conversational Computing (Редмонд, шт. Вашингтон) избавить наконец пользователей Интернета от мыши и клавиатуры.

Программы распознавания речи

Системы распознавания речи известны уже давно, однако для русского языка их до недавнего времени не существовало. Компания Dragon Systems - лидер в этой области - разработала программы, которые "со слуха" вводят в компьютер наговариваемый в микрофон текст на английском (в американском и британском варианте), итальянском, испанском, немецком, французском или шведском языке (фирма также реализовала распознавание для клингонского языка: популярность "Звездного похода" - Star Trek - так велика, что это имеет смысл).

Программы для диктовки, распознавания речи и управления голосом

Программы распознавания речи, рассмотренные ниже, разработаны лишь для диктования и дают возможности оперативно работать с вашим PC. Другой класс программ, известный под названием программы команды-контроля (command-and-control programs), позволяет вам управлять компьютером при помощи голосовых команд в естественной манере.

Мы рассмотрели четыре лучшие программы стоимостью от $60 до $100. Кроме того, мы ознакомились с некоторыми программами, предназначенными для непосредственной работы с текстовыми процессорами и броузерами.

Голосовые команды проникают в Сеть

Голосовой доступ к Сети позволит заменить сложные комбинации клавиш тонального набора, посредством которых сейчас обращаются к данным автоматических справочных бюро по телефону. VoxML базируется на языке веб-страниц HTML. Motorola предложит комплект инструментов разработки и передаст технологию в организацию по стандартизации.

Голосовое управление почтой

Американская компания iHello представила новую программу iHello Voice Outlook, созданную на основе технологии распознавания речи Nuance 8.0. Новое приложение позволяет при помощи телефонного звонка получать доступ к корпоративной электронной почте Microsoft Exchange, отвечать на запросы, а также звонить любому лицу, чьи координаты имеются в адресной книге Outlook, просто называя его имя вслух.

Устройства, управляемые голосом

Очередное соревнование между человеком и компьютером прошло осенью 2006 года на конференции, посвященной новинкам в области технологии распознавания речевых команд. Человечество представлял 17-тилетний Бен Кук, внесенный в книгу рекордов Гиннеса как человек, быстрее всех в мире набирающий текстовые сообщения (смс). Компьютеры же представлял не сверхсовременный монстр, а вполне обычный мобильный телефон. Самое удивительное было в том, что аудитория, собравшаяся на конференции, жаждала победы...телефона.

Управление голосом: FineDrive Voice 3.0

Компания FineDigital (Южная Корея) представила устройство для управления с помощью распознавания речи - FineDrive Voice 3.0, в основе которого используется движок распознавания речи от ETRI, он же – Fine SRTM 3.0.

Новое устройство дает возможность управлять приборами (к примеру телевизором) с помощью голоса. Остаётся надеяться, что этот движок распознавания речи будет поддерживать различные языки.

VoiceCom

VoiceCom - библиотека распознавания голосовых команд

Возможные области применения: контроль оборудования с помощью голоса; речевой запрос для баз данных, возможно, по телефону; поиск по ключевым словам в WAV файлах; встраивание голосовых функций в автономные устройства - программирование DSP.

ДОСТОИНСТВА Высокое быстродействие алгоритмов, небольшие требования к памяти, адаптация к шумам, независимость от языка и акцента.

Web-TalkIt

Web-TalkIt v1.2 программа предназначена для навигации в web-броузере с помощью голосовых команд. Создатель GROVER industries inc
Интерфейс программы выполнен в виде панели с кнопками управления и настройками.

Страницы