Ведущий Data Scientist (Reinforcement Learning & Research)

Вакансия в   ООО "Новые технологии" ( saina.ai )
Аккаунт зарегистрирован с публичной почты *@yandex.ru, не email компании!
Якутск, Россия
Миддл
Аналитика, Data Science, Big Data • Data scientist • Data Science • Machine Learning • Python • Логистика и транспорт
6 августа
Удаленная работа
Опыт работы от 3 до 5 лет
150 000 ₽
Работодатель  ООО "Новые технологии"
Описание вакансии

О нашем проекте

Мы работаем над системой управления доходами (RMS). Наши клиенты - российские авиакомпании.

Задача роли

Разработать и обучить RL-агента для управления доходами авиаперевозчика на уровне рынка: многопериодное принятие решений, ценовые уровни/классы бронирования, реакция спроса, конкуренция, неопределённость.

Зоны ответственности

  • Постановка формальной задачи RL: определение пространств состояний/действий/вознаграждения, ограничений и KPI.
  • Разработка и валидация симулятора рыночной среды на основе исторических данных (реакции спроса, сезонность, шоки).
  • Исследование и внедрение алгоритмов RL/IL (value-based, policy-gradient, actor-critic, off-policy/offline RL).
  • Экспериментальный дизайн: off-policy оценка, A/B в симуляторе, подготовка к онлайн-экспериментам.
  • Инструменты качества: стабильность обучения, воспроизводимость, мониторинг метрик (reward, RM KPI, робастность к шокам).
  • Взаимодействие с продуктом/инженерией: требования, передача моделей в прод, контроль деградаций.

Ожидаемые результаты (12 месяцев)

  • Прототип агента, превосходящий базовые эвристики по целевой метрике (например, дополнительная выручка на рейс/ОД) в симуляторе.

Специализация
Аналитика, Data Science, Big DataData scientistData ScienceMachine LearningPython
Отрасль и сфера применения
Логистика и транспорт
Уровень должности
Миддл
Загрузка формы отклика...