Аспирантский семинар: Методы и алгоритмы мультимодальной кластеризации
Докладчик: Дмитрий Гнатышак, аспирант первого года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук
Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 317
Время: 9 апреля, 18:30 – 20:00
Доклад состоится в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.
Задача кластеризации является одной из классических задач анализа данных. Обычные методы кластеризации, такие как k-means, иерархическая кластеризация или варианты искусственных нейронных сетей, выделяют лишь подгруппы во множестве объектов. Сходство таких объектов определяется на основе всех характеризующих их признаков (а также всех элементов прочих измерений: так в триадическом случае значения признаков зависят ещё и от некоторых условий). Однако для более точного анализа необходимо одновременно выделять подгруппы во всем измерениям, так как, например, некоторые объекты могут быть похожи друг на друга лишь по некоторым признакам при определённых условиях. Для эффективного выявления подобных закономерностей используются методы мультимодальной кластеризации.
Данные методы вместо группировки по одному измерению (множеству объектов) выделяют подгруппы в каждом из измерений. Часто на такие мультимодальные кластеры также накладываются некоторые дополнительные ограничения, такие как требования наличия одинаковых или похожих значений, минимального размера кластера.
В докладе будут описаны различные подходы к задаче мультимодальной кластеризации, разобраны некоторые важные методы и часто используемые критерии качества n-кластеров. Также будут указаны актуальные проблемы и текущие направления исследований.
Гнатышак Дмитрий Вадимович
Научно-учебная лаборатория интеллектуальных систем и структурного анализа: Стажер-исследователь