Репозиторий содержит файлы, используемые для реализации курса по Анализу текстов в ИТМО.
Лекции и вспомогательные материалы приведены в директории lectures.
Ресурсы для выполнения лабораторных работ расположены в директории tasks, каждой лабораторной работе соответствует отдельный каталог. Общие указания к выполнению лабораторных работ приведены в файле README.md
, расположенном в директории tasks. Инструкции к выполнению отдельных лабораторных работ приведены в файлах README.md
, расположенных в директориях /tasks/task-<TASK_NUMBER>
, где <TASK_NUMBER>
- номер соответствующей лабораторной работы:
- Сегментация и аннотация текста
- N-grams
- Векторизация текста
- Классификация текстов или Тематическое моделирование
- Поиск по векторной БД
- Question Answering
Результаты выполнения лабораторных работ оформляются в виде проектов и размещаются в отдельных директориях внутри каталога projects (также см. указания по выполнению лабораторных работ). В качестве названия директории испоьзуется название соответствующего проекта, которое необходимо указывать в соответствии с конвенцией kebab-case
. Соответствие между названием проекта и ФИО студента задается в следующей таблице:
Project name | Student name |
---|---|
emoji-labeller | Иванов Иван Иванович |
news-topic-classification | Гораш Вячеслав Игоревич |
aj-news-clusterization | Федотовских Евгений Александрович |
ag-news-classification | Веснин Дмитрий Владимирович |
twitter-bullying-classification | Шерман Марк Леонидович |
pg-news-dataset | Беликов Павел Геннадьевич |
news_nlp | Строкова Анастасия Владиславовна |
newsgroups-classification | Герасимчук Михаил Юрьевич |
fake-news-classifier | Артемьев Алексей Дмитриевич |
gp-news-classification | Проскурин Глеб Егорович |
nlp-news-topicks | Расковалова Алёна Дмитриевна |