ML Engineer / Tech Lead (NLP, Speech Processing, GenAI)

Москва, Россия
Сеньор
Информационные технологии • Разработка • Backend • Bash • Python
Удаленная работа • Частичная занятость • Работа в офисе
Опыт работы от 3 до 5 лет
300 000 ₽
О себе

На данный момент Ml инженер.

Мои компетенции и опыт

ML Engineer

NLP · Speech · RAG · Production

 

3 года в IT — и все в продакшене

 

 

ML / AI

*NLP & LLM*

BERT, fine-tuning, semantic routing, NER, embeddings, KeyBERT

LangChain, LangGraph, DSPy, Prompt Flow

RAG, LLM-as-judge, агенты с памятью, цепочки агентов

Self-hosted LLM: Ollama, A100, оптимизация инференса

Проприетарные модели: YandexGPT, GigaChat

ASR: Whisper (CPP), SaluteSpeech (on-prem), Yandex ASR

TTS: ElevenLabs, Sber TTS, Yandex TTS

Диаризация: Pyannote → NVIDIA NeMo (92% точность в полилогах)

Infrastructure

***

Transport: Kafka, gRPC, REST, WebSockets, WebRTC

Deploy: Docker, Docker-Compose, Nginx, GitHub Actions, Git

Backend: FastAPI, SQLAlchemy, Redis, PostgreSQL, S3

Observability: Grafana, Loki, Promtail, Tempo, OpenTelemetry

FFmpeg

 

*Проекты*

 

Семантический роутер

BERT-классификатор доменных / дефолтных запросов (текущее место)

95% точность на стенде, 90% на пользовательских данных

Каскадная архитектура: доменный → search+calc / дефолтный → агент генерации

Датасет синтезирован через LLM-аугментацию без реальных use-case

 

Продуктовая ML-система — текущее место

Architect / ML Engineer | 24 контейнера в проде (текущее место)

Гибридный поиск: ChromaDB (векторы) + Neo4j (связи) + Postgres (значения)

Агент извлечения данных + агент генерации ответов с памятью

Семантический роутер как API-gateway для всей системы

Nginx, Kafka, gRPC, локальный Docker Registry на своей VM

Единоличная ответственность за production-стенд: деплой, мониторинг, отказоустойчивость, инциденты

 

Семантический поиск

Fine-tuned embedder под доменные запросы (текущее место)

Построил пайплайн для data-lake: NER, нормализация, fine-tuning BERT/DeepSeek под поиск

 

Платформа управления ассистентами — Яндекс

ML Engineer | FastAPI + Yandex Cloud ML SDK (подрядчик)

E2E latency: 3+ сек → 1.2 сек через streaming и кеширование эмбеддингов

Postgres как feature store, собственные обёртки над ML SDK

Мониторинг: Grafana/Prometheus для трекинга latency и accuracy дрифта

 

Цифровые аватары — Северсталь, ДИТ Москвы

Developer / ML Engineer | LangChain + GigaChat + Voice (подрядчик)

RAG E2E: 1.3 сек, ускорение на 40% через оптимизацию запросов и стриминг токенов

Мультимодальность: ASR/TTS + чат, мультиязычность

Контекстная память (SQLite) + Telegram как fallback канал

 

Сервис диаризации

Architect | Whisper CPP + Pyannote → NVIDIA NeMo (подрядчик)

92% точность распознавания спикеров в полилогах

Экспорт в 5+ форматов включая адаптивные для юрлиц

 

SaluteSpeech on-prem — РуВики

DevOps / Integration Engineer | CentOS, Ansible подрядчик

Кластер из 9 нод, автоматизация тестирования синтеза через custom pytest-плагин

 

Образование

Национальный университет пищевых технологий, 2011

Стажировка на кафедре информатики — анализ данных, автоматизация

Сертификация Сбер · Обучение Яндекс · Менторство · Презентации для C-level

English — B2/C1. Technical documentation, code reviews, spoken communication.

 

О себе

Всё написанное выше — реальный прод, живые дедлайны и иногда пятница в 23:59. Умею трейсить спан от HTTP до Kafka и при этом считать cosine similarity руками. Знаю чем Моне отличается от Мане. В конце резюме — рецепт киш-лорена.

 

 

Рецепт киш-лорена(как и обещал)

Тесто: 200г муки, 100г масла, 1 яйцо, щепотка соли — вымесить, 30 мин в холодильник.

Начинка: бекон обжарить, 3 яйца + 200мл сливок + 100г грюйера — смешать.

Выпекать основу 10 мин при 180°C, залить начинку, ещё 25 мин. Подавать охлажденным.

нужен доступ к резюме Если это привлекло ваше внимание больше чем остальное — мы точно сработаемся.


Специализация
Информационные технологииРазработкаBackendBashPython
Отрасль и сфера применения

Уровень
Сеньор

Интересные кандидаты