Аспирантский семинар: демографические последовательности, медицинское обслуживание, масс-спектрометрия, фондовый рынок
Место: Факультет компьютерных наук, Кочновский проезд, д. 3, ауд. 205
Время: 27 октября, 18:10 – 19:30
Доклады состоятся в рамках научно-исследовательского семинара аспирантской школы по компьютерным наукам.
Первый доклад
Тема: Поиск закономерностей в демографических последовательностях на основе узорных структур
Докладчик: Данил Гиздатуллин, аспирант первого года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук
Анализ демографических последовательноcтей — популярное и многообещающее направление развития демографии. Жизнь людей можно рассматривать как последовательность происходящих событий — исследователям в области демографии интересен переход от анализа отдельных событий и их взаимосвязей к анализу полных последовательностей событий. Демографическое поведение может сильно разниться среди людей разных поколений, разного пола, уровня образования, и т. д., однако с помощью специально изобретенных техник могут быть найдены и обобщены скрытые сходства. И хотя уже изобретено множество методов для решения этой задачи она все еще далека от того, чтобы решаться стандартными методами анализа последовательностей — использование методов машинного обучения открывает для демографов новые возможности. Однако, как показано в работе, некоторые стандартные методы, которые используются в традиционном анализе последовательностей, не могут быть использованы напрямую и требуют специальной адаптации под нужды исследователей из других областей. В работе представлены результаты экспериментов применения узорных структур на последовательностях демографических данных в России. Использованы данные об одиннадцати поколениях в период с 1930 по 1984 годы для трех демографических волн, имевших место в 2004, 2007 и 2011 годах. Основная задача состояла в поиске закономерностей, которые являются (замкнутыми) частыми префиксами без “разрывов”. Эти ограничения — естественное требование демографов, необходимое для изучения первых событий на этапе взросления. Для решения этой задачи использованы узорные структуры неразрывных последовательностей и модифицированные префиксные деревья.
Второй доклад
Тема: Совершенствование процесса обслуживания в медицинских учреждениях на основе математических моделей потоков пациентов
Докладчик: Елизавета Прокофьева, аспирантка первого года обучения, кафедра инноваций и бизнеса в сфере информационных технологий школы бизнес-информатики факультета бизнеса и менеджмента
Моделирование потока пациентов в системе здравоохранения играет большую роль для понимания функционирования системы и может способствовать повышению эффективности ее работы. Суть совершенствования модели сводится к тому, чтобы учесть особенности обслуживания пациентов того или иного типа медицинского учреждения, что позволит конечным пользователям получить на выходе прогнозные значения, которые впоследствии смогут служить отправной точкой для принятия решений. В докладе будет рассмотрен пример применения эрланговской системы с ожиданием для моделирования потока пациентов в отделении скорой и неотложной медицинской помощи.
Третий доклад
Тема: High-dimensional generative probabilistic models for peptide-spectrum matching in tandem mass spectrometry
Докладчик: Павел Сулимов, аспирант первого года обучения, департамент анализа данных и искусственного интеллекта факультета компьютерных наук
Current approaches to spectra identification obtained from tandem mass spectrometer are based on database searching approaches in which spectra are iteratively compared against a large collection of theoretical spectra. The comparison is usually carried out by using similarity functions such as hyperscore in X!Tandem, or XCORR in Sequest, Tide, and Comet. These similarity functions are essentially based on the scalar product of the vector representation of the experimental and the theoretical spectra and provide limited insights into the nature of the peptide molecule fragmentation.
In this talk, I will introduce a new approach in which the matching of an experimental spectrum to a theoretical spectrum is modelled by undirected, probabilistic graphical models. The experimental spectrum can be represented via a positive real valued vector and a theoretical spectrum can be represented via a bit vector. In this scenario, we aim to model the joint distribution of an observed and an unobserved data using Restricted Boltzmann Machines trained directly on observed spectra obtained from real experiments. This approach will provide a more accurate data identification method which will help experimental biologists reveal the process of the peptide fragmentation.
Четвертый доклад
Тема: Эвристическая эконофизическая модель фондового рынка как открытой неравновесной системы
Докладчик: Виталий Сильчев, аспирант первого года обучения, кафедра инноваций и бизнеса в сфере информационных технологий школы бизнес-информатики факультета бизнеса и менеджмента
Предложена простейшая нелинейно-динамическая модель фондового рынка как открытой неравновесной системы. Модель построена из "первых принципов" функционирования фондового рынка. Дается обоснование исходных положений модели. Динамическими переменными являются отклонение цены спроса от соответствующего равновесного значения, отклонение цены предложения от соответствующего равновесного значения и мгновенная разность числа рыночных агентов, обладающих максимальной и минимальной информацией об активе. Полученная нелинейная динамическая система имеет один управляющий параметр — интенсивность внешнего потока информации. Рассмотрены возможности и ограничения модели.
Гиздатуллин Данил Кутдусович
Прокофьева Елизавета Сергеевна
Сильчев Виталий Артемович
Сулимов Павел Андреевич