НовостиОпубликовано в журнале "Компьютерра" №16 от 26 апреля 2005 года. Страница 15 из 24. Вернуться на первую страницу. «А язычок у тебя хорошо подвешен…»
Все началось пять лет назад — с увесистой «говорящей головы» (размером примерно на треть больше человеческой). В ее конструкции было предусмотрено пятнадцать степеней свободы, шесть из которых приходилось на гибкий «язык». Увы, вместо связной речи сей агрегат мог лишь жалобно мычать: весь его фонетический багаж сводился лишь к пяти гласным звукам. Появившегося через год «наследника» удалось обучить нескольким согласным, так что он уже мог произнести название родного института. Следующая модель овладела согласными, а позапрошлогодней версии робота покорились носовые и раскатистые горловые звуки. Возможности же нынешней, четвертой генерации «говоруна» куда богаче: ее произношение, уверяют японцы, вплотную приблизилось к человеческому. Как и положено артисту разговорного жанра, WT-4 обладает всеми необходимыми для этого причиндалами. Мощное ораторское дыхание создают «легкие», в роли которых выступает воздушный насос. Оперативно меняющий положение при помощи натягиваемых строп «язык», скользящий вдоль пластикового «нёба», позволяет добиваться тончайших нюансов звучания, при этом вместительная «носоглотка» обеспечивает специфический прононс, хорошо знакомый изучающим французский язык. Слова слетают с резиновых «губ», которые двигаются при помощи кулис, управляемых сервомоторами. В отличие от своих предшественников WT-4 снабжен туловищем и конечностями, которыми он энергично жестикулирует, произнося свои монологи. Хотя перспективы «трудоустройства» робота довольно туманны (кого в компьютерный век удивишь говорящей игрушкой?), исследователи убеждены, что их детище представляет собой превосходный лабораторный экспонат, призванный пролить свет на не разгаданные до конца тайны акустики и особенности строения речевого аппарата. Открывающиеся при этом перспективы впечатляют. Так, по мнению японцев, постижение речевой модели позволит создать потрясающие алгоритмы сжатия речи: вместо громоздких волновых гармоник можно будет в кодированной форме передавать данные о положении виртуальных «губ» и «языка». Кроме того, на базе полученной модели можно будет строить интерактивные тренажеры для обучения новичков иностранным языкам, способные в прямом смысле «ставить язык» своим подопечным. Первое официальное выступление «говоруна» состоится на очередной конференции Американского акустического общества, которая пройдет в Ванкувере в середине мая. Впрочем, в биографии WT-4 точку ставить рано: в Университете Васеда сейчас кипит работа над следующей версией, WT-5. Интересно, о чем она нам поведает? — Д.К.
|