DataLens — Cервис визуализации и анализа данных, позволяющий создавать аналитические дашборды с диаграммами, таблицами и другими вариантами визуализации над различными источниками. В DataLens есть четыре основных объекта:
- Подключение — параметры доступа к источнику данных
- Датасет — набор данных из источника и их метаописание.
- Виджет — визуализация данных в виде графиков и таблиц.
- Дашборд — страница с набором виджетов и управляторов.
Пример дашборда в DataLens https://datalens.yandex.ru/dashboards/ixbje4smtvyog
Необходимо проанализировать данные по футболистам:
- Определить самую массовую национальность футбольстов
- Определить период, когда рождались футболисты с самими высоки зарплатами на текущий период
- Проанализировать зависимость веса/роста/возраста от зарплаты
Одим из доступных источников данных для DataLens являются CSV-файл. В случае работы с CSV-файлом он предварительно предзагружается в хранилище DataLens для дальнейшего исполнения запросов.
- Перейдите на страницу Datalens. Если вы находитесь на странице дашборда, то кликните на логотип Yandex Datalens.
- В правом меню нажимаем на Подключения. Отображется список доступных вам подключений.
- Нажимаем Создать датасет
- В диалоговом окне отображается список доступных подключений, на основе которых можно создать датасет. Мы хотим создать новое подлючение на основе файла Footbal.csv
- Нажимаем Создать подключение в правом верхнем углу.
- Выбираем CSV
- Нажимаем Выбрать CSV-файл.
- Указываем файл Footbal.csv. До загрузки файла может понадобится некоторое время (5-10 секунд).
- Нажимаем Сохранить
Датаест описывает набор данных из источника, определяет принадоежность полей к измерениям и показателям, типы агрегаций для показателей, вычисляемые поля.
- Дублируем поле ID: нажимаем на троеточие в равой части строки с полем, далее пункт меню Продублировать
- Переименовываем ID в footballer ID
- Переименовываем ID (1) в Count
- Для поля Count меняем тип агрегации на CountUniq, поле меняет цвет на синий становясь показателем
- Необходимо посчитать возраст футболистов в годах, нажмаем Добавить поле в правом верхнем углу
- Назвываем поле Age
- Вводим формулу
int((today()-[birth_date])/365)
, сохраняем - Дублируем поле eur_salary
- Переименовываем eur_salary в eur_salary sum
- Переименовываем eur_salary (1) в eur_salary avg
- Для поля eur_salary sum меняем тип агрегации на Sum
- Для поля eur_salary avg меняем тип агрегации на Avg
- Сохраняем датасет, нажимаем Сохранить
- Нажимаем Создать чарт
Визуализация данных настраивается в Визарде. Интерфейс Визарда делится на три области:
- Справа — область выбора с измерениями и показателями датасета.
- Посередине — область настройки визуализации.
- Слева — область превью.
- Выбираем столбчатую диаграмму в области настройки визуализаций
- Выносим nationality на ось X, Count на Ось Y
- Выносим Count в сортировку, меняем порядо сортировки по убыванию
- Выделяем часть графика с максимальными значениями столбцов, смотрим какие страны в лидерах
- Удаляем текущие поля из секций (оси, сортировка)
- Выносим birth_date на ось X, eur_salary avg на Ось Y
- Понимаем, что дата слишком детальная, необходимо округлить до месяца
- Создаем вычисляемое поле, нажимаем на знак "+" рядом с названием датасета в панели выбора сверху
- Называем поле birth_month
- Вводим формулу округления
datetrunc([birth_date], 'month')
- Выносим birth_month на ось X вместо birth_date
- Смотрим какие месяца были самими урожайными на успешных футболистов
- Удаляем текущие поля из секций (оси, сортировка)
- Создаем вычисляемое поле "Avg Age" с формулой
AVG([Age])
(нажимаем на знак "+" рядом с названием датасета в панели выбора сверху) - Создаем вычисляемое поле "Avg Weight" с формулой
AVG([weight_kg])
- Создаем вычисляемое поле "Avg Height" с формулой
AVG([height_cm])
- Меняем тип визуализации на Точечная диаграмма
- Выносим nationality в секцию Точки, Avg Age на Ось X, eur_salary avg на Ось Y
- Смотрим есть ли зависимотьс
- Меняем nationality на club в секции Точки
- Меняем club на full_name в секции Точки
- Аналогично смотрим зависимости eur_salary avg с Avg Weight и Avg Height
- в какой день родилось больше всего футболистов?
- игроки какой страны самые маленье?
- в каком клубе лучший показатель EUR/kg (отношение заработной платы на вес футболиста)?