HSE, 2024
- Сфера НТИ: None
- Бизнес-задача: Создание системы для предсказания пола пользователя по данным его браузера для рекламной рекомендательной системы.
- Результат работы: модель предсказания пола пользователя с метрикой ROC-AUC = 0.962
Решение польностью представлено в ноутбуке hack.ipynb. Запуск занимает ~27 Гб RAM!
Модель представляет из себя параллельные блок трансформера и MLP, где первый блок обрабатывает последователности действий пользователя, а второй входные векторы из таблицы векторов. Выходы этих блоков передаются в fc-слой.
- Чтение и объединение входных таблиц.
- преобразование транзакционных данных 2d-таблицы в 3d-тензор последовательностей действий каждого пользователя отдельно.
- Искусственное увеличение датасета в 4 раза путем перемешивания действий пользователя и конкатенации со старыми данными.
- Обучение модели transfomer+mlp
- [Рамиль Габдрахманов]((https://t.me/ramil2911)