Notice: Undefined offset: 6 in /var/www/www-root/data/www/374.ru/tpl_text/text_picture.php on line 73
Математики и программисты из Санкт-Петербургского института информатики и автоматизации РАН, который в этом году празднует свой 30-летний юбилей, вместе с коллегами из Дрезденского технологического института и российской компании NewVoice разработали российскую технологию распознавания голоса.
В Российской Академии Наук сообщили, что система SIRIUS (Spiiras Interface for Recognition and Integral Understanding of Speech), которую авторы представили на V Международной специализированной выставке «Робототехника» (17-20 октября 2007, Москва) – представляет собой систему автоматического распознавания и интегрального понимания русской речи. Пока в словаре системы тысяча слов, которые компьютер уверенно выделяет и распознает в слитной, что очень важно, речи пользователя. Однако это не предел.
В принципе система позволяет оперативно пополнять словарь новыми словами и оборотами, что интересно – с учетом фонологических и морфологических особенностей русской разговорной речи. То есть всякие, например, московские «аканья» или вологодские «оканья» ее не смутят, говорят разработчики. Кто бы и как бы ни произнес уже известное системе слово, она уверенно выделит его из словесного потока и среагирует заданным образом – переадресует звонок тому, кто обладает нужной информацией, если это SIRIUS-секретарь, или перейдет к следующему, уточняющему вопросу, если это SIRIUS-справочная.
Однако всякого рода справочно-информационные службы – это не единственное направление деятельности SIRIUS. Есть и другие. Так, например, по замыслу авторов, он может быть частью системы, позволяющей управлять ПК в бесконтактном режиме – только движением глаз, лица и голосом. Соответствующую систему специалисты из СПИИ РАН разрабатывают не первый год, и значительно продвинулись в этом направлении. Они уже создали одну из первых российский многомодальных систем, названную ICanDo, которая позволяет управлять курсором без мышки – только движениями лица или вообще взглядом.
Для этого видеокамера отслеживает перемещения пяти точек на лице человека (зрачки, кончик носа, центр верхней губы и середина переносицы) и использует полученную информацию так же, как и сигнал, полученный при перемещении мышки. Если же информация компьютеру будет поступать синхронно двумя потоками – звуковым, благодаря использованию системы распознавания речи, и оптическим, это существенно повысит и эффективность, и точность работы всей системы в целом. А уж область применения подобных универсальных систем практически безгранична – от помощи инвалидам, лишенным возможности двигаться, до бесконтактного управления бытовой техникой и «умными домами».
Хотите прокомментировать?
Кроме того...
Катастрофа планетарного масштаба
Две большие планеты...
Световое граффити
Рисовать можно не только на стенах балончиками с краской, но и светом в воздухе...
История 8 марта
Все началось в начале весны 1857 года, когда текстильщицы Нью-Йорка прошли "маршем...