preprocess data initial processing 전처리 이후 최종 포맷 post의 count vector | 이미지 개수 | 이모티콘 개수 | 느낌표 개수 | MBTI 개수 | http 개수 전처리 내용 http 단독으로 있는거 삭제 알파벳 only 전체 소문자 알파벳 stopword 삭제 lemmatizing stemming