Подготовка данных для анализа: сбор данных, загрузка данных, преобразование данных в удобный для исследования вид, проверка их качества, аналитические выводы;
Работа с Python;
Генерация новых features, ad-hoc аналитика;
Разработка метрик;
Взаимодействие с заказчиком;
Разработка технической документации;
Тесное взаимодействие с командой разработки и Data Science.
Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:
Хорошее знание математики, системное мышление;
Опыт работы хотя бы с одной СУБД (PostgreSQL, Oracle, MySQL или другие);
Уверенный уровень SQL (сложные запросы, оконные функции и тд);
Опыт работы с Python (pandas, numpy, визуализация и тд);
Опыт построение визуализации в QlikSense;
Понимание принципов анализа данных, умение делать выводы и представлять их в наглядном виде;
Опыт работы с проектной документацией.
Дополнительными плюсами будут:
Опыт работы с экосистемами Hadoop/Cloudera (Hive, Spark);
Разработка новых продуктивных объектов и сервисов;
Знание основ статистики;
Знание и понимание основ статистики и теории вероятности;
Понимание базовых принципов машинного обучения (опыт взаимодействия с DSами).