Skip to content

TermProject-BigData-2021-2/preprocess

Repository files navigation

preprocess

data initial processing

전처리 이후 최종 포맷

post의 count vector | 이미지 개수 | 이모티콘 개수 | 느낌표 개수 | MBTI 개수 | http 개수

전처리 내용

  • http 단독으로 있는거 삭제
  • 알파벳 only
  • 전체 소문자 알파벳
  • stopword 삭제
  • lemmatizing
  • stemming

About

data initial processing

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published