Решение задачи мультилейбл классификации спутниковых изображений Амазонки.
Включает 40479 классифицированных изображений(256x256x3) и 17 классов. Скачать датасет и данные можно отсюда.
-
Создание и активация окружения
python3 -m venv /path/to/new/virtual/environment
source /path/to/new/virtual/environment/bin/activate
-
Установка пакетов
В активированном окружении:
a. Обновить pip
pip install --upgrade pip
b. Выполнить команду
pip install -r requirements.txt
-
Разбиваем датасет на 3 части(train_df.csv, valid_df.csv, test_df.csv):
ROOT_PATH=/data/planet-understanding-the-amazon-from-space python train_test_split.py
P.S. В папке ROOT_PATH необходимо, чтобы ОТДЕЛЬНО лежал файл train.csv с классифицированными изображениями из датасета, а также папка с тренировочными изображениями train-jpg.
-
Настройка ClearML
a. В своем профиле ClearML нажимаем: "Settings" -> "Workspace" -> "Create new credentials"
b. Появится инструкция для "LOCAL PYTHON", копируем её.
с. Пишем в консоли
clearml-init
и вставляем конфиг из инструкции.
Запуск тренировки c nohup
:
CUDA_VISIBLE_DEVICES=0 OMP_NUM_THREADS=1 ROOT_PATH=/data/planet-understanding-the-amazon-from-space nohup python train.py > log.out
Запуск тренировки без nohup
:
CUDA_VISIBLE_DEVICES=0 OMP_NUM_THREADS=1 ROOT_PATH=/data/planet-understanding-the-amazon-from-space python train.py
Метрики и конфигурации экспериментов:
-
Инициализация DVC
В директории проекта пишем команды:
dvc init
dvc remote add --default myremote ssh://91.206.15.25/home/aleksandrminin/dvc_files
dvc remote modify myremote user aleksandrminin dvc config cache.type hardlink,symlink
подробнее про типы линков можно почитать здесь.
-
Добавление модели в DVC
Копируем в
weights
обученную модельcd weights dvc add model.pt dvc push
-
Делаем коммит с новой моделью:
git add . git commit -m "add new model"
git pull origin main
dvc pull