<한국직업전문학교 무재칠시 프로젝트> with 김남원
KBO의 경기결과를 세이버메트릭스로 예측하는 프로젝트
Crawling.ipynb: 필요한 자료를 csv파일 형태로 크롤링 DataPreprocessing.ipynb: csv파일의 전처리 ModelSelection.ipynb: 어떤 알고리즘으로 학습할 것인지 테스트하기 MachineLearning.ipynb: 실제 기계학습 SearchList.py :뷰티풀수프 활용한 크롤링 모듈 BaseballGameResult.py: score를 승무패 혹은 승1패로 바꿔주는 모듈 승1패는 스포츠복권의 방식으로 1점차승부나 무승부를 1로 처리하는 것
선발선수/경기결과: http://www.statiz.co.kr/boxscore.php?
WAR: http://www.statiz.co.kr/stat.php?
각 경기 홈팀과 원정팀의 최근(직전 달)WAR
승무패 정확도는 로지스틱 모델을 사용시 55% 이상이었다
무승부와 1점승부를 예측하는 것은 불가능하므로 이러한 방식으로 스포츠복권에서 유의미한 적중률을 기대하긴 어려워보인다.
다만 찍어서 맞추는 것 이상의 적중률은 기대할 수 있다.
무승부를 예측하기 어려운 이유로 실력이 비슷한 팀간의 승부를 예측할 수 없는 것 외에 무승부인 경기데이터 자체가 적은 것을 들 수 있다. 무승부인 데이터를 제하고 예측한다면 성적을 향상시킬 수 있다.