ML-инженер

Москва, Россия

Миддл • Сеньор

Аналитика, Data Science, Big Data • OLAP • PowerBI • Data Science • Machine Learning • Python • SQL • VBA • Apache Spark • Hadoop • MapReduce • Greenplum • PostgreSQL • Spark

16 февраля в 17:40

Релокация • Удаленная работа • Работа в офисе
Опыт работы от 3 до 5 лет

Есть файл резюме (защищен)

Короткая ссылка: gkjb.ru/g14GX

Пригласить

О себе

На данный момент ML-инженер.

Мои компетенции и опыт

ML инженер с опытом 3х + лет. Делаю прогнозы многомерных временных рядов, нормализацию товарных данных (SKU), импутацию пропусков и автоматизацию отчётности end-to-end: от сырых данных до дашбордов и сервисов в Docker. Фокус: классический ML, временные ряды, NLP (Transformers, GenAi), также имею интерес к CV. Веду студенческие AI-проекты до демо-результата, выстраиваю валидацию и метрики.
========================================================
Навыки: ML/DS Computer Vision (детекция, сегментация, трекинг), Time Series (прогнозирование, rolling CV), NLP (Transformers, эмбеддинги), ML, дизайн экспериментов и метрик, валидация, работа с шумными бизнес-данными Инструменты Python (pandas, NumPy, scikit-learn, PyTorch/TensorFlow), CatBoost, Prophet, SQL (PostgreSQL/Greenplum), Airflow, Docker, MLflow, FastAPI, Dash/Plotly, Streamlit, Git/GitLab, Linux Опыт работы
========================================================
Суммарный коммерческий опыт: 3+ лет
НИУ ВШЭ — Руководитель учебных AI-проектов / ассистент курсов (part-time) Сен 2025 — н.в. ( 6 мес.)
• Веду две команды по time series (2 и 3 человека) и одну команду по CV (3 человека). Курирую проекты, помогаю с планом экспериментов, постановкой задач и интерпретацией результатов.
• TS-проект (акции + новости): прогноз стоимости акций с учётом новостного фона: текстовые эмбеддинги (Transformers) + временные признаки, rolling CV, сравнение классических моделей и нейросетей.
• CV-проект (номерные знаки): детекция и сегментация номеров авто (YOLO + OCR) для автоматизации контроля доступа. • Регулярные код-ревью, разбор валидации и метрик; помогаю избегать утечек и переобучения на публичные сэты.
• Стек: Python (pandas, NumPy, scikit-learn, CatBoost, Prophet, PyTorch, Yolo, Transformers), Docker, FastApi
========================================================
Самокат — ML-аналитик Авг 2023 — Сен нужен доступ к резюме года 2 месяца)
• Отвечал за долгосрочные прогнозы обращений, аналитику для продуктов/операций, нормализацию SKU и автоматизацию отчётности.
• Прогноз спроса: реализовал rolling CV и модели на CatBoost/Prophet → sMAPE по ключевым категориям снизился на 10–15%, прогнозный bias держится в пределах ±3–4%. • Импутация пропусков и аномалий: построил пайплайн контроля качества данных → доля “битых” записей, требующих ручной правки, уменьшилась на 25–30%.
• Нормализация SKU: автоматический matching через эмбеддинги (Transformers) и similarity search → точность сопоставления 85–90%, сильно снизилась доля ручной проверки. • Мультимодальный классификатор обращений: модель по фото товара и тексту обращения определяет тип тикета (качество товара, комплектация, доставка и т.п.) → macro-F1 по основным классам нужен доступ к резюме , доля неправильно маршрутизированных обращений снизилась на 20–25%.
• LLM-бот для саммари обращений: бот сокращает и структурирует описание обращения → средняя длина текста уменьшилась на 40–50%, время первичной обработки обращений по данным A/B-теста сократилось на 10–15%.
• Отчётность: автоматизировал Dash/Plotly + SQL/Greenplum отчёты для продуктов и операций → время подготовки регулярной отчётности сократилось примерно на 60%, задержка решений по операциям 30–40%.
• Стек: Python (pandas, NumPy, scikit-learn, CatBoost, Prophet), PyTorch, Transformers (HF), GenAi, SQL (Greenplum/PostgreSQL), Airflow, Docker, Dash/Plotly, MLflow, Linux.
========================================================
All Cups (VK) — ML Reviewer (part-time) фев 2023 — авг нужен доступ к резюме мес.)
• Ревью задач и бейзлайнов по CV/NLP/ML для платформы All Cups: постановка, метрики, валидация, качество базовых решений.
• Проверял корректность сплитов, метрик и baseline-моделей; систематические утечки/ошибки в валидации находились примерно в 20–25% присылаемых задач. • Давал краткие рекомендации по фичерингу, балансировке классов и настройке валидации.
• Стек: Python, NumPy, pandas, scikit-learn, PyTorch, классический ML (CV/NLP), SQL.
========================================================
Проекты
• CV / Оценка калорийности по фото: пайплайн YOLO-segmentation + ResNet-50 для оценки объёма/калорийности блюда по фото. Ошибка по основным категориям 15–20% при времени инференса < 0.5 с/изображение. Сервис: Docker, FastAPI, Streamlit, Docker Compose.
• CV / Трекинг авто для шлагбаума: YOLO-детекция + трекинг авто с камеры. Точность детекции машин на реальных сценариях > 95% при стабильном real-time fps на доступном железе.
========================================================
Мои соц-сети:
• GitHub нужен доступ к резюме
• Telegram нужен доступ к резюме
• Email нужен доступ к резюме
• Телефон нужен доступ к резюме

Есть файл резюме (защищен)

Пригласить

Интересные кандидаты