MedSpeak

Радиологи выводят нас на самый передний край распознавания речи, поскольку IBM специально для них разработала пакет распознавания и диктовки непрерывного потока речи. Пакет MedSpeak/Radiology 1.1 (4495 долл.) представляет собой интенсивно использующую центральный процессор систему клиент-сервер со словарем на 25 тыс. слов, работающую под управлением Windows NT. Ее способность распознавания почти в реальном времени и высокая точность, показанная во время наших испытаний, предвещают этой системе хорошее будущее.

Значительную часть дня врача-радиолога занимает диктовка медицинских отчетов по результатам рентгеновских и томографических обследований. MedSpeak помогает врачам составлять эти отчеты быстрее и точнее, так как врач может видеть отчеты на экране в письменном виде непосредственно в ходе диктовки.

Для испытания программы мы прочитали несколько примеров радиологических отчетов, предоставленных нам врачом. Результаты оказались поразительными. Даже без тренировки системы на распознавание конкретного голоса MedSpeak обеспечил запись с точностью почти 100%. Слова появлялись на экране через долю секунды после их произнесения, даже когда мы намеренно произносили их слитно. MedSpeak даже правильно понимал наше чисто фонетическое произношение некоторых мало знакомых медицинских терминов.

Хотя язык, используемый в этих отчетах, для большинства из нас иностранный, он состоит из относительно небольшого словаря медицинских терминов и ряда простых английских слов.

MedSpeak - это система клиент-сервер, базирующаяся на ОС Windows NT и состоящая из трех компонент. Для работы с базой данных, содержащей записанные отчеты, применяется приложение сервера и используется процессор базы данных DB2 фирмы IBM. Приложение клиента выполняет собственно распознавание и определяет транскрипцию речи, а необязательное приложение ввода команд предоставляет возможность секретарю врача или другому канцелярскому работнику вводить отчеты в базу данных вручную. Один сервер может обслуживать много клиентов, диктующих отчеты. В нашей версии MedSpeak используется микрофон фирмы Sennheiser радиовещательного качества; вместо него можно применить гарнитуру фирмы AKG, которая стоит на 100 долл. меньше.

Распознавание речи в реальном масштабе времени требует значительной вычислительной мощности. Поэтому для работы с MedSpeak фирма IBM рекомендует использовать 200-МГц микропроцессор Pentium Pro, хотя мы достигали точности почти 100%, работая с MedSpeak на 200-МГц Pentium.

Согласно сообщению IBM, методику распознавания, используемую в MedSpeak, можно приспособить для любой профессии, в которой применяется достаточно ограниченный словарь, например для других областей медицины, для юридических специальностей, и в конечном счете эта методика будет использоваться в потребительских продуктах с распознаванием речи.

Плюсы: самая высокая безошибочность распознавания, простота использования. Поддержка разработчиком.

Условия использования: Цена: 4495 долл

Разработчик: IBM http://www.ibm.com/

Теги: 
Голосование: 
0
Голосов пока нет