Аспирантский семинар: "Применение трикластеризации в анализе текстов на естественных языках"

Мероприятие завершено

Докладчик: Дмитрий Егурнов, аспирант третьего года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук
Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 205
Время: 25 марта, 18:10 – 19:30 

Доклад состоится в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.

Доклад посвящен проблеме извлечения семантического фрейма из текстов на естественном языке без учителя (unsupervised semantic frame induction). Задача состоит в автоматическом определении тематики текста. Рассматриваемые подходы основываются на разбиении N-грамм слов из обучающего корпуса текстов на кластеры, которые объединяются некоторым смысловым значением (фреймом). Вхождение триграмм из нового текста в такие кластеры может говорить о том, что в этом тексте затрагиваются соответствующие смысловые значения. Основное внимание уделено методам Triframes и NOAC (Triclustering).