Data Analyst / Data Scientist

Москва, Россия
Миддл
Аналитика, Data Science, Big Data • Data scientist • Аналитик • Исследователь • Разработчик • Data Science • Machine Learning • Product аналитика • Python • SQL
Релокация • Удаленная работа • Частичная занятость • Работа в офисе
Опыт работы от 1 года до 3х лет
200 000 ₽
Есть файл резюме (защищен)
О себе

На данный момент Аналитик.

Мои компетенции и опыт

Обо мне

Data Analyst с 3+ годами экспертизы в кредитном анализе, ML и разработке аналитических систем. Подтверждённый опыт построения ML-пайплайнов, деплоя production-решений и измеримого бизнес-импакта через валидацию моделей. Уверенно веду end-to-end ML проекты — от постановки задачи и feature engineering до production deploy с мониторингом.

Ищу позицию Middle Data Analyst / Data Scientist

Навыки

Technical Stack: Python, TensorFlow, PyTorch, NumPy, Pandas, Scikit-learn, XGBoost, CatBoost 

Data & SQL: PostgreSQL, SQLAlchemy, Dask, A/B-тестирование, проверка гипотез 

ML: CV, Classic ML, LLM, NLP, LangChain 

Backend: FastAPI, Streamlit, Django, Jinja2, Selenium, BeautifulSoup 

MLOps / DevOps: MLflow, Docker, nginx, Git, Metabase, Airflow

Опыт

- Credit Scoring Model: Спроектировал с нуля скоринговую модель классификации кредитных рейтингов на базе ансамбля (CatBoost / XGBoost / ExtraTrees) с анализом feature importance — финальный VotingClassifier составил F1 ~ 87% на горизонте 1–3 года.

-Document Intelligence Pipeline (OCR + LLM): Спроектировал pipeline для структурированного извлечения данных из финансовых PDF: PaddleOCR → LLM-постобработка. Превзошёл baseline в ~70% случаев по распознаванию таблиц и ключевых полей — позволил частично заменить ручную обработку документов.

- ML Platform (versioning + feature monitoring): Реализовал mlpipeline: scikit-learn + MLflow + PostgreSQL с YAML-конфигом и веб-интерфейсом. MLflow Model Registry — версионирование моделей, feature drift мониторинг, трекинг экспериментов — сократил цикл итераций и операционную нагрузку при обновлении моделей в продакшне.

- Automated Data Acquisition (CV + Parsing): Разработал CNN-классификатор (Keras / TensorFlow, accuracy 91%) для автоматизации визуальной верификации при сборе данных — полная замена ручного труда для задач извлечения данных.

- Report Generation Microservice: Спроектировал и развернул микросервис генерации аналитических отчётов (FastAPI + Jinja2 + Streamlit) с поддержкой шаблонов и автоматической подстановкой данных из БД, заменив ручную сборку документов. Время подготовки отчётов сократилось на ~70%.

- Validation & A/B Testing: Внедрил PSI, VIF, PD и A/B-фреймворк для сравнения методологий — точность валидации +8%; 5+ улучшений приняты в официальную методологию агентства.

 

Дополнительные достижения

Автор статей, опубликованных в журналах ВАК по теме анализа и прогнозирования кредитных рейтингов

Английский язык — подтверждён сертификатом TOEFL

Победы и призовые места в олимпиадах:

  • Всероссийская олимпиада «Я — профессионал» (направления: «Математическое моделирование» нужен доступ к резюме Призер)
  • Международные и всероссийские олимпиады по прикладной математике, программированию и анализу данных
  • Участие и призёрство в ICPC (International Collegiate Programming Contest)
  • Руководство разработкой курсов по прикладной математике и численным методам для студентов технических направлений


Есть файл резюме (защищен)


Интересные кандидаты