ML Engineer / Tech Lead (NLP, Speech Processing, GenAI)
Москва, РоссияСеньор
Удаленная работа • Частичная занятость • Работа в офисе
Опыт работы от 3 до 5 лет300 000 ₽
Опыт работы от 3 до 5 лет300 000 ₽
Короткая ссылка: gkjb.ru/g179v
О себе
На данный момент Ml инженер.
Мои компетенции и опыт
ML Engineer
NLP · Speech · RAG · Production
3 года в IT — и все в продакшене
ML / AI
*NLP & LLM*
BERT, fine-tuning, semantic routing, NER, embeddings, KeyBERT
LangChain, LangGraph, DSPy, Prompt Flow
RAG, LLM-as-judge, агенты с памятью, цепочки агентов
Self-hosted LLM: Ollama, A100, оптимизация инференса
Проприетарные модели: YandexGPT, GigaChat
ASR: Whisper (CPP), SaluteSpeech (on-prem), Yandex ASR
TTS: ElevenLabs, Sber TTS, Yandex TTS
Диаризация: Pyannote → NVIDIA NeMo (92% точность в полилогах)
Infrastructure
***
Transport: Kafka, gRPC, REST, WebSockets, WebRTC
Deploy: Docker, Docker-Compose, Nginx, GitHub Actions, Git
Backend: FastAPI, SQLAlchemy, Redis, PostgreSQL, S3
Observability: Grafana, Loki, Promtail, Tempo, OpenTelemetry
FFmpeg
*Проекты*
Семантический роутер
BERT-классификатор доменных / дефолтных запросов (текущее место)
95% точность на стенде, 90% на пользовательских данных
Каскадная архитектура: доменный → search+calc / дефолтный → агент генерации
Датасет синтезирован через LLM-аугментацию без реальных use-case
Продуктовая ML-система — текущее место
Architect / ML Engineer | 24 контейнера в проде (текущее место)
Гибридный поиск: ChromaDB (векторы) + Neo4j (связи) + Postgres (значения)
Агент извлечения данных + агент генерации ответов с памятью
Семантический роутер как API-gateway для всей системы
Nginx, Kafka, gRPC, локальный Docker Registry на своей VM
Единоличная ответственность за production-стенд: деплой, мониторинг, отказоустойчивость, инциденты
Семантический поиск
Fine-tuned embedder под доменные запросы (текущее место)
Построил пайплайн для data-lake: NER, нормализация, fine-tuning BERT/DeepSeek под поиск
Платформа управления ассистентами — Яндекс
ML Engineer | FastAPI + Yandex Cloud ML SDK (подрядчик)
E2E latency: 3+ сек → 1.2 сек через streaming и кеширование эмбеддингов
Postgres как feature store, собственные обёртки над ML SDK
Мониторинг: Grafana/Prometheus для трекинга latency и accuracy дрифта
Цифровые аватары — Северсталь, ДИТ Москвы
Developer / ML Engineer | LangChain + GigaChat + Voice (подрядчик)
RAG E2E: 1.3 сек, ускорение на 40% через оптимизацию запросов и стриминг токенов
Мультимодальность: ASR/TTS + чат, мультиязычность
Контекстная память (SQLite) + Telegram как fallback канал
Сервис диаризации
Architect | Whisper CPP + Pyannote → NVIDIA NeMo (подрядчик)
92% точность распознавания спикеров в полилогах
Экспорт в 5+ форматов включая адаптивные для юрлиц
SaluteSpeech on-prem — РуВики
DevOps / Integration Engineer | CentOS, Ansible подрядчик
Кластер из 9 нод, автоматизация тестирования синтеза через custom pytest-плагин
Образование
Национальный университет пищевых технологий, 2011
Стажировка на кафедре информатики — анализ данных, автоматизация
Сертификация Сбер · Обучение Яндекс · Менторство · Презентации для C-level
English — B2/C1. Technical documentation, code reviews, spoken communication.
О себе
Всё написанное выше — реальный прод, живые дедлайны и иногда пятница в 23:59. Умею трейсить спан от HTTP до Kafka и при этом считать cosine similarity руками. Знаю чем Моне отличается от Мане. В конце резюме — рецепт киш-лорена.
Рецепт киш-лорена(как и обещал)
Тесто: 200г муки, 100г масла, 1 яйцо, щепотка соли — вымесить, 30 мин в холодильник.
Начинка: бекон обжарить, 3 яйца + 200мл сливок + 100г грюйера — смешать.
Выпекать основу 10 мин при 180°C, залить начинку, ещё 25 мин. Подавать охлажденным.
нужен доступ к резюме Если это привлекло ваше внимание больше чем остальное — мы точно сработаемся.
