Даниил Скоринкин рассказал об оцифровке текстов Л.Н. Толстого на AIUCD 2017 в Риме

Доклад аспиранта школы по филологическим наукам был посвящен образовательной стороне работы над цифровым изданием писателя, участию в ней студентов и волонтеров.

Даниил Скоринкин рассказал об оцифровке текстов Л.Н. Толстого на AIUCD 2017 в Риме

Конференция Ассоциации гуманитарной информатики и цифровой культуры Италии проходит уже в шестой раз и посвящена различным аспектам применения информационных технологий и количественных методов исследования в гуманитарных областях. В этом году доминантными темами стали т.н. «дальнее чтение» и совместная работа исследователей над большими объемами данных.

Доклад «Digital Edition of Leo Tolstoy's complete works» был сделан в рамках воркшопа, посвященного социальному и образовательному аспекту работы над критическими изданиями текстов. Даниил Скоринкин рассказал о том, как осуществлялась первоначальная оцифровка 90-томного наследия великого писателя, что после этого происходило с оцифрованными текстами Толстого в новой электронной среде и как эта активность стала частью не только образовательного, но и общественного процесса.

Рассказ об оцифровке 90-томного собрания сочинений, которая привлекла более трех тысяч волонтеров из 49 стран мира и 259 городов России (проект «Весь Толстой в один клик»), вызвал явный интерес у участников конференции. Слушателей впечатлили скорость и масштаб отклика оцифровщиков-добровольцев, самые активные из которых распознали и вычитали по 1-2 тысячи страниц, объясняя свою продуктивность тем, что от текстов Толстого невозможно оторваться.

Оцифровка собрания сочинений писателя стала катализатором целого ряда активностей в цифровой среде. При участии школы лингвистики НИУ ВШЭ было разработано мобильное приложение «Живые страницы» для интерактивного чтения классики — первым произведением в нем стала «Война и мир». В дальнейшем данные из этого приложения были использованы для сайта, посвященного чтению романа «Война и мир» в телеэфире. Одновременно  в школе лингвистики началась разработка цифрового издания Л.Н. Толстого с семантической разметкой и возможностью расширенного поиска по метаданным. Эта работа продолжается и сегодня, для разметки используется международный стандарт кодирования текстографической информации TEI, в подготовке издания активно участвуют студенты бакалавриата и магистратуры.