Научно-исследовательский семинар: "Аннотированные суффиксные деревья как средство интерпретации текстов"
Докладчик: Екатерина Черняк, аспирант факультета компьютерных наук
Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 402
Доклад состоится в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.
В докладе будет дано определение аннотированного суффиксного дерева (АСД), будут представлены алгоритмы для его построения и показаны примеры использования АСД в практических задачах.
Строго говоря, АСД является одной из многочисленных моделей представления документа наряду с векторной моделью (vector space model) или языковой моделью (language model). Модель представления документа — это способ представления неструктурированного документа с помощью той или иной математической структуры. Существует несколько классов таких моделей: векторная модель, языковая модель, модели скрытых тем, суффиксные деревья.
АСД обладает некоторым преимуществом над остальными моделями, поскольку позволяет учитывать нечеткие совпадения подстрок любой длины. Кроме того, в модели АСД естественным образом может быть определена мера релевантности строки документу. К ограничениям и недостаткам модели АСД относятся большие затраты по времени и памяти по сравнению с другими моделями и отсутствие интерактивных алгоритмов для ее использования.
Артемова Екатерина Леонидовна
Департамент анализа данных и искусственного интеллекта: Преподаватель