Аспирантский семинар: "Ансамблевая кластеризация: методы, эксперименты и приложения"
Докладчик: Андрей Шестаков, аспирант первого года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук
Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 317
Время: 17 сентября, 18:30 – 20:00
Доклад состоится в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.
Методы кластеризации позволяют объединять множество объектов в кластеры, которые характеризуются некоторой однородностью элементов, в них входящих. Однако результатом разных алгоритмов кластеризации могут оказаться отличающиеся друг от друга разбиения одного и того же множества объектов. Ансамблевая кластеризация (кластерный консенсус) — это процедура агрегирования профиля разбиений в единую кластерную структуру, которая по некоторому критерию наилучшим образом характеризует данный профиль разбиений.
Принцип наименьших квадратов для агрегирования разбиений, описанный Б.Г. Миркиным, позволяет выразить два симметричных критерия, порождающих два способа формирования кластерного консенсуса. В первом случае ищется такое согласованное разбиение, которое наиболее точно воспроизводит данный профиль разбиений. Во втором — разбиение, которое наилучшим образом восстанавливается из данного профиля разбиений.
В докладе помимо изложенного выше метода будут рассмотрены другие подходы к построению согласованного разбиения, эксперименты по сравнению этих методов на реальных и сгенерированных данных, а также некоторые приложения консенсусной кластеризации.
Миркин Борис Григорьевич
Научно-учебная группа «Методы анализа и визуализации веб-корпусов»: Научный руководитель
Шестаков Андрей Владимирович
Научно-учебная группа «Методы анализа и визуализации веб-корпусов»: участник