Аспирантский семинар — Зимние встречи лауреатов стипендии имени Ильи Сегаловича

Мероприятие завершено

Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 317
Время: 18 февраля, 18:30 – 20:00 

Доклады состоятся в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам и зимних встреч лауреатов стипендии имени Ильи Сегаловича.

Первый доклад

Тема:  Вероятностное тематическое моделирование и нейросетевые модели языка для обучения векторного представления слов, контекстов и документов
Докладчик: Анна Потапенко, аспирантка второго года обучения, базовая кафедра Яндекс департамента больших данных и информационного поиска факультета компьютерных наук

Для успешного анализа текстовой информации важно научиться преобразовывать слова и документы в векторное представление, с которым могли бы работать стандартные методы машинного обучения, в частности, классификаторы. Наиболее простым подходом является построение «мешка слов», где каждый документ представляется разреженным вектором с частотами встретившихся слов. Однако гораздо лучше с этой задачей справляются современные подходы, основанные на нейронных сетях. Интересно, что эти подходы имеют тесную связь с более разработанными моделями дистрибутивной семантики и, в частности, с тематическими моделями. В докладе будут представлены первые эксперименты, эксплуатирующие понимание этой связи, а также предложены способы комбинирования двух подходов, позволяющие объединить преимущества тематических и нейросетевых моделей языка. 

Второй доклад

Тема:  Оптимальные графы для децентрализованного поиска
Докладчик:  Александр Пономаренко, аспирант второго года обучения, кафедра прикладной математики и информатики факультета информатики, математики и компьютерных наук (Нижний Новгород)

Одним из подходов к построению структуры данных для поиска ближайшего соседа является организация входных данных в виде графа. Если зафиксировать алгоритм поиска, то задачу формирования графа на основе входных данных размера n можно рассматривать как задачу оптимизации. В этом случае целевой функцией будет вычислительная сложность алгоритма поиска, а пространством решений — множество всех графов, имеющих n вершин. В докладе будет представлена математическая формулировка этой задачи. Также будут представлены оптимальные графы для частных случаев, когда входными данными являются узлы целочисленной решётки.

Третий доклад

Тема:  Computational models for Geo-localization problems
Докладчик:  Андрей Шестаков, аспирант второго года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук

В целях геолокации мобильных устройств могут быть использованы три источника сигналов: сигналы GPS, сигналы беспроводных интернет сетей Wi-Fi или мобильных сетей LTE/GSM. Локализация с помощью GPS характеризуется достаточно высокой точностью на открытом пространстве, однако требует значительного потребления энергоресурсов. Использование Wi-Fi хоть и более энерговыгодно, но ограничено лишь локализацией в помещении. Как в случае Wi-Fi, так и в случае GPS, пользователи редко на постоянной основе оставляют их включенными, в то время как мобильные сети являются источником практически постоянного, но иногда крайне зашумленного сигнала. Методы анализа данных и распознавания образов были успешно применены для анализа мобильности пользователей мобильных телефонов и локализации в помещении, однако редко использовались в задаче локализации на открытом пространстве.

В докладе будут разобраны как базовые методы локализации по сигналу мобильных сетей, так и некоторые подходы к решению данной задачи с помощью методов машинного обучения.