ML Engineer

Москва, Россия
Стажер • Джуниор
Аналитика, Data Science, Big Data • Data scientist • Разработчик • Data Science • Machine Learning • Python • MySQL • PostgreSQL • Инженер
Удаленная работа • Работа в офисе
Опыт работы от 1 года до 3х лет
100 000 ₽
О себе

На данный момент Монтажник РЭА.

Мои компетенции и опыт

Студент 4 курса, Московского Политеха, специальность "Автоматизация технических процессов и производств". Начинающий ML Engineer с фундаментальными знаниями в математической статистике и практическим опытом построения end-to-end ML-пайплайнов. Стремлюсь применять и развивать навыки в машинном обучении и анализе данных для решения бизнес-задач в сильной инженерной команде.
 

Проекты.

1. Фреймворк для автоматизированного сравнения ML-моделей

Стек: Python, Scikit-learn, Pandas, XGBoost, Joblib, imbalanced-learn.

Задача: Создать универсальный инструмент для быстрого бенчмаркинга и выбора оптимальной модели для задач бинарной классификации.

Разработал модульную функцию best_model_search, инкапсулирующую полный пайплайн: обработку смешанных данных (ColumnTransformer), отбор признаков (SelectFromModel), оптимизацию гиперпараметров (GridSearchCV) и оценку.

Реализовал возможность гибкого тестирования различных алгоритмов (RandomForest, XGBoost) через передачу словаря с моделью и параметрами.

Добавил анализ важности признаков и сравнение моделей по метрикам качества и скорости выполнения.

Результат: На датасете Heart Disease выяснил, что сложные ансамбли дают прирост всего + нужен доступ к резюме % к ROC-AUC (до нужен доступ к резюме ), но требуют в нужен доступ к резюме раз больше времени, чем LogisticRegression. Создал воспроизводимый инструмент, ускоряющий этап экспериментов.

2. Классификатор изображений на базе EfficientNetB2

Стек: Python, TensorFlow/Keras, Pandas, NumPy, Matplotlib, ImageDataGenerator.

Задача: Разработать точный классификатор изображений, устойчивый к переобучению на датасетах разного размера.

Построил end-to-end пайплайн загрузки и аугментации данных с использованием нужен доступ к резюме t.

Применил Transfer Learning, взяв за основу предобученную EfficientNetB2. Добавил кастомные слои с L1/L2-регуляризацией и Dropout (70%).

Настроил процесс обучения с использованием callback'ов EarlyStopping и ReduceLROnPlateau.

Результат: Достиг точности нужен доступ к резюме % на тестовой выборке датасета PetImages (25k изображений). Создал документированный код с README.

Опыт работы

Монтажник РЭА | ООО "НПО НаукаСофт" | 2024 — н.в.

Сборка и отладка радиоэлектронной аппаратуры по техническим схемам.

Достижение: Участие в рабочей группе по автоматизации отчётности в роли аналитика. Получил рекомендацию от заместителя генерального директора для перехода в IT-команду.

Менеджер (повышение через месяц) | ООО "Самоцвет" | 2023 — 2024

Управление командой, контроль операционной деятельности и кассовой дисциплины.

Обучение новых сотрудников, решение конфликтных ситуаций.

Достижение: Показал себя ответственным сотрудником и был повышен до менеджера уже через месяц, где отвечал за команду, отчётность и контроль стандартов, получив опыт операционного управления и наставничества



Интересные кандидаты