Skip to content

Cold start 문제 개선

thkyang324 edited this page Feb 7, 2023 · 30 revisions

사용하는 추천모델의 입력과 출력은 모두 아이템입니다.

아이템 소모내역이 없는 새로운 유저에겐 어떻게 상품을 추천할 수 있을까요?

기존 방식

기존 방식

    저희는 새로운 유저에 대한 추론 데이터셋을 다음과 같이 구성했습니다.

  • 오늘의 집의 "집들이" 글을 통해 이미지와 스타일 라벨 수집
  • 스크린샷 2023-02-07 오후 4 04 38
  • 스타일 별로 5개의 이미지를 무작위로 선택 (스타일 카테고리 개수 11개 * 무작위 5개 = 55개의 이미지)
  • 회원가입 시 55개의 이미지를 유저에게 보여주고, 5개 이상의 취향에 맞는 이미지를 선택
  • 회원가입-기존
  • 유저가 고른 이미지에서 사용된 상품 중 소파, 선반처럼 유저의 취향이 반영되어 있는 카테고리의 상품을 유저의 Default 데이터로 활용
  • 스크린샷 2023-02-07 오후 4 09 03

만약 55개의 이미지 중 사용자 취향에 맞지 않는 이미지가 보여진다면 어떨까요?

유저가 선택에 불만족하여 서비스를 떠나가는 계기가 될 수 있습니다.

기존 방식의 문제점

기존 방식에선 스타일이라는 라벨을 통해 보여지는 이미지를 구분했습니다. 뭐가 문제였을까요?

스타일별개수

스타일 라벨 별 데이터 분포가 고르지 못한것을 볼 수 있습니다. 이러한 불균형을 포함한 데이터를 신뢰하긴 힘들어 보입니다.

내추럴이미지 뜬금없는-이미지들

왼쪽은 내추럴로 분류되어 있는 이미지입니다. 저는 모던이라고 생각하는데.. 어떠신가요?

스타일은 이처럼 주관적인 생각이 많이 반영됩니다. 스타일 라벨만으로 이미지를 구분하긴 어려워 보이네요.

오른쪽 사진들을 스타일별로 구분하긴 힘들어 보입니다. 특히 사람이 등장하는 이미지는 인테리어보단 재미있게 짐볼을 타는 귀여운 아이들에 시선이 쏠리네요.

해결해야 할 문제를 정의하면 다음과 같습니다.

  • 사람이 등장하면 시선이 분산됩니다. 필터링을 진행하겠습니다.
  • 스타일이 아닌 다른 방법으로 이미지를 나누어 봅시다.

해결과정

YOLO 도입기
이미지를 벡터로!

결과

모델적용결과
Clone this wiki locally