Научно-исследовательский семинар: "Аннотированные суффиксные деревья как средство интерпретации текстов"

Мероприятие завершено


Докладчик: Екатерина Черняк, аспирант факультета компьютерных наук
Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 402

Доклад состоится в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.

В докладе будет дано определение аннотированного суффиксного дерева (АСД), будут представлены алгоритмы для его построения и показаны примеры использования АСД в практических задачах.

Строго говоря, АСД является одной из многочисленных моделей представления документа наряду с векторной моделью (vector space model) или языковой моделью (language model). Модель представления документа — это способ представления неструктурированного документа с помощью той или иной математической структуры. Существует несколько классов таких моделей: векторная модель, языковая модель, модели скрытых тем, суффиксные деревья.

АСД обладает некоторым преимуществом над остальными моделями, поскольку позволяет учитывать нечеткие совпадения подстрок любой длины. Кроме того, в модели АСД естественным образом может быть определена мера релевантности строки документу. К ограничениям и недостаткам модели АСД относятся большие затраты по времени и памяти по сравнению с другими моделями и отсутствие интерактивных алгоритмов для ее использования.