MLFlow 를 사용한 Iris 데이터셋의 랜덤 포레스트 분류 모델 학습 파이프라인입니다.
- Python 3.8 이상
- Docker
- MLFlow
- 현재 디렉토리
$ pwd
~/ml-system-in-actions/chapter2_training/iris_sklearn_rf
- 라이브러리 인스톨 이 프로그램에서 사용하는 라이브러리는 requirements.txt에 기재되어 있습니다.
$ make dev
# 실행 커맨드
# pip install -r requirements.txt
# 출력 생략
- 학습용 Docker 이미지 빌드 학습에 사용할 Docker 이미지를 빌드합니다.
$ make d_build
# 실행 커맨드
# docker build \
# -t shibui/ml-system-in-actions:training_pattern_iris_sklearn_rf_0.0.1 \
# -f Dockerfile .
# 출력 생략
# docker 이미지로 shibui/ml-system-in-actions:training_pattern_iris_sklearn_rf_0.0.1 이 빌드됩니다.
- 학습 파이프라인 실행 mlflow 로 학습 파이프라인을 실행합니다.
$ make train
# 실행 커맨드
# mlflow run . --no-conda
# 출력 예
# 2021/02/11 11:25:49 INFO mlflow.projects.docker: === Building docker image iris_sklearn_rf:6fa928e ===
# 2021/02/11 11:25:59 INFO mlflow.projects.utils: === Created directory /var/folders/v8/bvkzgn8j1ws6y76t4z5nt6280000gn/T/tmpmr52x6kk for downloading remote URIs passed to arguments of type 'path' ===
# 2021/02/11 11:25:59 INFO mlflow.projects.backend.local: === Running command 'docker run --rm -v ~/book/ml-system-in-actions/chapter2_training/iris_sklearn_rf/mlruns:/mlflow/tmp/mlruns -v ~/book/ml-system-in-actions/chapter2_training_patterns/iris_sklearn_rf/mlruns/0/63250dc8faed4917b9870ebfbbe32aa3/artifacts:~/book/ml-system-in-actions/chapter2_training_patterns/iris_sklearn_rf/mlruns/0/63250dc8faed4917b9870ebfbbe32aa3/artifacts -e MLFLOW_RUN_ID=63250dc8faed4917b9870ebfbbe32aa3 -e MLFLOW_TRACKING_URI=file:///mlflow/tmp/mlruns -e MLFLOW_EXPERIMENT_ID=0 iris_sklearn_rf:6fa928e python -m iris_train \
# --test_size 0.3 ' in run with ID '63250dc8faed4917b9870ebfbbe32aa3' ===
# 2021/02/11 11:26:05 INFO mlflow.projects: === Run (ID '63250dc8faed4917b9870ebfbbe32aa3') succeeded ===
학습은 수분 이내로 완료됩니다.