Почти все посетители нашего сайта, так или иначе, имели дело с технологиями распознавания речи. Например, когда мы по три-четыре раза повторяем в микрофон мобильного телефона имя друга, номер которого нужно набрать, а телефон наотрез отказывается понимать. С таким состоянием дел вряд ли можно надеяться на то, что в ближайшем будущем можно будет общаться на вольные темы, например, с роботом.
Но команда из Университета Карнеги Меллон (Carnegie Mellon University, CMU) уверена в обратном. Используя грант от Национального Фонда Науки США (National Science Foundation) в миллион долларов, они хотят улучшить качество систем распознавания речи в 100 — 1000 раз.
Именно для этой цели профессор университета CMU Роб Рутенбар (Rob Rutenbar) представил на конференции Hot Chips специальный процессор для обработки речи. Профессор уверен, что для совершенствования распознавания речи необходимо улучшать не программы, а аппаратную часть устройств. «Никто ведь не рисует пиксели при помощи программ. Для этого нужно быть сумасшедшим», комментирует Рутенбар. «Видеоданные на мобильном телефоне не рисуются программным обеспечением. Для этого есть небольшой видеопроцессор».
В последнее время некоторые компании действительно создали современное программное обеспечения для распознавания речи, которое используется в крупных CALL-центрах и т.п. Но для работы этого ПО требуется значительно больше вычислительной мощи, чем может предоставить, например, мобильный телефон.
Тем не менее, команда CMU во главе с Рутенбаром представила «облегченную версию» аппаратной системы распознавания речи, которая успешно прошла испытание и конвертировала слова «When will Windows arrive?» («Когда появится Windows?») в текст на экране.
На данный момент система Рутенбара «знает» только 1000 слов, причем только в том случае, если произносить их медленно. К концу года команда CMU планирует увеличить это количество до 5000, а в следующем году — до 10000 и 50000.
Учитывая то, что, кроме Национального Фонда Науки США, разработки Рутенбара и CMU поддержали еще Агентство перспективных исследований при министерстве обороны США (The Defense Advanced Research Projects Agency, DARPA), а также Министерство внутренней безопасности (Department of Homeland Security), можно предположить, что проект может быть использован и в военных целях. Кроме того, службы безопасности смогут в случае надобности не прослушивать телефонные звонки, а читать их на экранах компьютеров.
- « оценка: 1 (2 чел.) » +
|
Устанавливайте линк на Ладошки на своих сайтах, изучайте коммерческую информацию,
посещайте разделы сайта (форум, чат, новости, файлы, прочие). Оцените эту новость и оставьте свой комментарий ниже на странице.