- flaskapp/
- Папка front-end
- flaskapp/utils.py
- Файл для пакетной обработки текстов.
- flaskapp/ml/inference.py
- Файл для получения предсказания.
- flaskapp/ml/train
- Папка файлами обучения моделей классификации.
- aug.py
- Файл создания искусственных данный для обучения
- classification.py
- Файл обучени классических классификаторов (logreg, pac, svc)
- performer_classifier.py
- Файл для классификации с помощью CatBoost
- ner.py
- Файл получения локации из текста
- preprocessing.py
- Файл очистки текста
- spell_and_summarization.py
- Файл исправления текста и извлечения главной мысли из текста
- text_utils.py
- Файл мелких функций обработки текста (например, перевод на английский язык)
- main.py
- Основной файл приложения
- requirements.txt
- Файл, содержащий список зависимостей Python, необходимых для запуска проекта.
Чтобы запустить проект, выполните следующие шаги:
- Убедитесь, что у вас установлен Python.
- Установите инструмент для создания изолированной среды Python
- pip install virtualenv
- pip install virtualenvwrapper-win
- Создайте изолированную среду в Python
- python3 -m venv venv
- Активируйте созданную виртуальную среду
- venv\Scripts\activate или venv\Scripts\activate.bat
- Установите необходимые зависимости, выполнив следующую команду:
- pip install -r requirements.txt
- Добавьте в папку ml/catboost/ модель my_cat_boost_model_2 с гугл-диска:
- Запустите приложение, выполнив следующую команду:
- python main.py
После этого ваше приложение будет доступно по адресу http://127.0.0.1:8000/
.
При первом запуске приложение будет скачивать необходимые модели.
Могут возникнуть проблемы с установкой библиотеки torch. Чтобы исправить это:
- В терминале выполните команду:
- pip uninstall torch
- Перейдите на официальный сайт библиотеки https://pytorch.org/
- Выполните команду установки как предложено на сайте. Это может выглядить следующим образом:
- pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
Установите совместимые CUDA и Cudnn