Skip to content

My solution for VKxHSE hack. Gender prediction based on browser history and useragent.

Notifications You must be signed in to change notification settings

Ramil2911/gender_predictor_recsys_transformer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

Решение кейса «Предсказание гендера по данным браузера»

HSE, 2024

Описание

  • Сфера НТИ: None
  • Бизнес-задача: Создание системы для предсказания пола пользователя по данным его браузера для рекламной рекомендательной системы.
  • Результат работы: модель предсказания пола пользователя с метрикой ROC-AUC = 0.962

Запуск решения

Решение польностью представлено в ноутбуке hack.ipynb. Запуск занимает ~27 Гб RAM!

Модель

Модель представляет из себя параллельные блок трансформера и MLP, где первый блок обрабатывает последователности действий пользователя, а второй входные векторы из таблицы векторов. Выходы этих блоков передаются в fc-слой.

Пайплайн

  1. Чтение и объединение входных таблиц.
  2. преобразование транзакционных данных 2d-таблицы в 3d-тензор последовательностей действий каждого пользователя отдельно.
  3. Искусственное увеличение датасета в 4 раза путем перемешивания действий пользователя и конкатенации со старыми данными.
  4. Обучение модели transfomer+mlp

Команда

Используемый стек и технологии

PyTorch Python Markdown NumPy Pandas

About

My solution for VKxHSE hack. Gender prediction based on browser history and useragent.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published