Аспирантский семинар: векторные модели и информационный поиск, анализ формальных понятий и нейронные сети

Мероприятие завершено

Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 317
Время: 3 марта, 18:30 – 20:00 

Доклады состоятся в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.

Первый доклад

Тема: Обучение векторных моделей без учителя в задачах информационного поиска
Докладчик: Олег Найдин, аспирант первого года обучения, базовая кафедра Яндекс департамента больших данных и информационного поиска факультета компьютерных наук

В задачах информационного поиска активно используются векторные модели языка, т.е. строятся отображения слов/документов/запросов в некоторое векторное пространство. Дальше, используя размеченный набор данных и стандартные методы машинного обучения, легко получить классификатор релевантности документа запросу. Однако часто разметить большую выборку для обучения достаточно сложно или дорого, поэтому активно развиваются векторные модели языков, обучаемые без учителя. В докладе будет представлен обзор наиболее известных таких моделей, а также приведены примеры их использования в реальных задачах информационного поиска.

 

Второй доклад

Тема: Применение методов анализа формальных понятий для построения оптимальной архитектуры нейронной сети
Докладчик:  Нуртас Махажанов, аспирант второго года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук

Выбор подходящей структуры нейронной сети для анализируемых данных является одной из важных частей при внедрении прогнозирующей модели. Если количество нейронов в сети будет больше оптимального количества, то велика вероятность построить переобученную модель. В противном случае, при недостаточном количестве нейронов, возникает риск того, что построенная модель будет способна улавливать не все зависимости в анализируемой выборке. Существуют различные эвристические подходы и рекомендации для выбора подходящей структуры нейронной сети. В докладе будет представлен подход с применением анализа формальных понятий для получения предварительной информации об анализируемых данных с целью дальнейшего построения оптимальной архитектуры нейронной сети.