3 июня–открытая лекция от одного из создателей Kinect, Ивана Ташева в Политехническом музее

3 июня 2011 г., в 16:00, в Политехническом музее, Иван Ташев прочтёт открытую лекцию для студентов “Аудио для Kinect: то, что практически невозможно”. Для участия в лекции необходимо зарегистрироваться. По ссылке также находится более подробная информация о мероприятии.

Доктор Иван Ташев работает главным архитектором в группе технологий речи Microsoft Research. Он внес свой вклад в создание алгоритмов и разработок многих продуктов корпорации Майкрософт; его последняя работа связана с конвейером обработки звука в Kinect. Иван Ташев является автором и соавтором сорока заявок на патенты США, четырех книг и семидесяти научных работ. Его последняя книга «Sound Capture and Processing» (Захват и обработка звука) была опубликована в издательстве Wiley в 2009 году.

На лекции обсуждаются аспекты акустического дизайна и конвейера обработки звука в устройстве Kinect – наиболее успешно продаваемом электронном устройстве за всю историю, вошедшем в Книгу рекордов Гиннеса. Основные трудности, связанные с аудио на устройстве Kinect, – это звук из динамиков, эхо и шумы в помещении, а также большой динамический диапазон звучания. Благодаря технологиям, разработанным в Microsoft Research, конвейер обработки звука может устранять ненужные шумы и выдавать выходной сигнал, качества которого будет достаточно для распознавания голоса и голосового общения при разговоре на расстоянии до четырех метров и воспроизведении звуков в динамике на полной громкости. Кроме того, здесь обсуждаются новые сценарии использования этого устройства и возможности, которые открываются вне сферы компьютерных игр при создании более совершенного интерфейса для взаимодействия человека и компьютера. Благодаря Kinect разработчики пользовательских интерфейсов могут воспользоваться преимуществами двух дополнительных средств взаимодействия: жестов и речи. Речь полезна при выборе нужного пункта в большом списке элементов («Воспроизвести песню о подводной лодке группы "Битлз"»), тогда как жесты хорошо подходят для выбора в более коротких списках – например, для выбора нужной песни из четырех-пяти композиций, возвращенных после приведенного выше примера «нечеткого» голосового запроса. Объединение этих аспектов в мультимодальный пользовательский интерфейс позволяет разрабатывать более органичные и интуитивно понятные способы взаимодействия с компьютером. Кроме того, будут предоставлены некоторые демонстрационные материалы, посвященные описываемым технологиям.