Senior data analyst (scientist)
Прямой работодатель ЦИАН ГРУПП ( cian.ru )
Опыт работы от 3 до 5 лет
👋 Привет! Я Ира, рекрутер компании Циан, крупнейшего в России сервиса для поиска недвижимости.
В рамках Циан функционирует Центр моделирования. ЦМ состоит из аналитиков, совмещающих в себе сразу несколько функций - data scientist, продуктового аналитика, bi и в части инженера данных.
Задачи ЦМ
- разработка и поддержание моделей онлайн-оценки недвижимости Циан;
- разработка витрин для формирования аналитики по рынку недвижимости;
- разработка аналитических продуктов по рынку недвижимости, как для внешних так и для внтуренних пользователей;
- предоставление данных о рынке недвижимости партнерам Циан - именно для поддержания этой истории мы ищем кандидата.
Задачи старшего аналитика (ds)
- Поддержка и оптимизация алгоритмов оценки недвижимости (модели оценки стоимости, ликвидности, конкурентного окружения) с использованием методов машинного обучения;
- Разработка, поддержание и развитие аналитических и b2b витрин данных Циан;
- Построение аналитических моделей по запросу;
- Продуктовая аналитика - подведение результатов экспериментов, построение продуктовых аналитик.
Условия
- Мы ищем старшего аналитика с прицелом на то, что в дальнейшем отдадим ему задачи лидирования всего ЦМ, поэтому это супер-шанс прокачать свой грейд в экспертной команде;
- Мы привыкли говорить на языке целей, а не конкретных проектов, поэтому у тебя будет много свободы, как впрочем и ответственности;
- Гибридный режим работы: можно в офисе в Москве или Петербурге, можно — удалённо;
- 5 d-off в год дополнительно к отпуску;
- Компенсация спорта;
- ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны).
Что важно знать и уметь
- SQL на уверенном уровене;
- Теорию вероятности, владеть приемами математического моделирования и статистического анализа. Знать принципы математической статистики и построения статистических моделей (регрессионный, дисперсионный и логит-регрессионный анализ. как минимум), многомерного анализа (кластерный, факторный анализ, метод главных компонент), проверки статистических гипотез, построения временных рядов (ARMA, ARIMA и т.п.). Уметь интерпретировать качество полученных моделей;
- основные подходы многомерного анализа;
- принципы работы распределенных БД экосистемы Hadoop (Hive, Presto);
- работать с большими объемами данных (в экосистеме Hadoop - как преимущество), писать оптимальный SQL-код.