Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

Аспирантский семинар: "Ансамблевая кластеризация: методы, эксперименты и приложения"

Мероприятие завершено

Докладчик: Андрей Шестаков, аспирант первого года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук
Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 317
Время: 17 сентября, 18:30 – 20:00 

Доклад состоится в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.

Методы кластеризации позволяют объединять множество объектов в кластеры, которые характеризуются некоторой однородностью элементов, в них входящих. Однако результатом разных алгоритмов кластеризации могут оказаться отличающиеся друг от друга разбиения одного и того же множества объектов. Ансамблевая кластеризация (кластерный консенсус) — это процедура агрегирования профиля разбиений в единую кластерную структуру, которая по некоторому критерию наилучшим образом характеризует данный профиль разбиений.

Принцип наименьших квадратов для агрегирования разбиений, описанный Б.Г. Миркиным, позволяет выразить два симметричных критерия, порождающих два способа формирования кластерного консенсуса. В первом случае ищется такое согласованное разбиение, которое наиболее точно воспроизводит данный профиль разбиений. Во втором — разбиение, которое наилучшим образом восстанавливается из данного профиля разбиений.

В докладе помимо изложенного выше метода будут рассмотрены другие подходы к построению согласованного разбиения, эксперименты по сравнению этих методов на реальных и сгенерированных данных, а также некоторые приложения консенсусной кластеризации.