Data Analyst / Data Scientist

Москва, Россия

Миддл

Аналитика, Data Science, Big Data • Data scientist • Аналитик • Исследователь • Разработчик • Data Science • Machine Learning • Product аналитика • Python • SQL

5 марта в 14:57

Релокация • Удаленная работа • Частичная занятость • Работа в офисе
Опыт работы от 1 года до 3х лет200 000 ₽

Есть файл резюме (защищен)

Короткая ссылка: gkjb.ru/g12rT

Пригласить

О себе

На данный момент Аналитик.

Мои компетенции и опыт

Обо мне

Data Analyst с 3+ годами экспертизы в кредитном анализе, ML и разработке аналитических систем. Подтверждённый опыт построения ML-пайплайнов, деплоя production-решений и измеримого бизнес-импакта через валидацию моделей. Уверенно веду end-to-end ML проекты — от постановки задачи и feature engineering до production deploy с мониторингом.

Ищу позицию Middle Data Analyst / Data Scientist

Навыки

Technical Stack: Python, TensorFlow, PyTorch, NumPy, Pandas, Scikit-learn, XGBoost, CatBoost

Data & SQL: PostgreSQL, SQLAlchemy, Dask, A/B-тестирование, проверка гипотез

ML: CV, Classic ML, LLM, NLP, LangChain

Backend: FastAPI, Streamlit, Django, Jinja2, Selenium, BeautifulSoup

MLOps / DevOps: MLflow, Docker, nginx, Git, Metabase, Airflow

Опыт

- Credit Scoring Model: Спроектировал с нуля скоринговую модель классификации кредитных рейтингов на базе ансамбля (CatBoost / XGBoost / ExtraTrees) с анализом feature importance — финальный VotingClassifier составил F1 ~ 87% на горизонте 1–3 года.

-Document Intelligence Pipeline (OCR + LLM): Спроектировал pipeline для структурированного извлечения данных из финансовых PDF: PaddleOCR → LLM-постобработка. Превзошёл baseline в ~70% случаев по распознаванию таблиц и ключевых полей — позволил частично заменить ручную обработку документов.

- ML Platform (versioning + feature monitoring): Реализовал mlpipeline: scikit-learn + MLflow + PostgreSQL с YAML-конфигом и веб-интерфейсом. MLflow Model Registry — версионирование моделей, feature drift мониторинг, трекинг экспериментов — сократил цикл итераций и операционную нагрузку при обновлении моделей в продакшне.

- Automated Data Acquisition (CV + Parsing): Разработал CNN-классификатор (Keras / TensorFlow, accuracy 91%) для автоматизации визуальной верификации при сборе данных — полная замена ручного труда для задач извлечения данных.

- Report Generation Microservice: Спроектировал и развернул микросервис генерации аналитических отчётов (FastAPI + Jinja2 + Streamlit) с поддержкой шаблонов и автоматической подстановкой данных из БД, заменив ручную сборку документов. Время подготовки отчётов сократилось на ~70%.

- Validation & A/B Testing: Внедрил PSI, VIF, PD и A/B-фреймворк для сравнения методологий — точность валидации +8%; 5+ улучшений приняты в официальную методологию агентства.

Дополнительные достижения

Автор статей, опубликованных в журналах ВАК по теме анализа и прогнозирования кредитных рейтингов

Английский язык — подтверждён сертификатом TOEFL

Победы и призовые места в олимпиадах:

Всероссийская олимпиада «Я — профессионал» (направления: «Математическое моделирование» нужен доступ к резюме Призер)
Международные и всероссийские олимпиады по прикладной математике, программированию и анализу данных
Участие и призёрство в ICPC (International Collegiate Programming Contest)
Руководство разработкой курсов по прикладной математике и численным методам для студентов технических направлений