Дисципліна MLOps

Прикладна дисципліна | 6 модулів | ~4 години загалом

Огляд

MLOps привносить інженерну суворість у машинне навчання. Більшість проєктів ML зазнають невдачі не через погані моделі, а через те, що команди не можуть перетворити їх на працюючий продукт. Дата-саєнтисти будують прототипи; MLOps перетворює їх на промислові системи.

Цей трек охоплює повний життєвий цикл ML — від відстеження експериментів та магазинів ознак (feature stores) до обслуговування моделей, моніторингу та автоматизованих конвеєрів — даючи вам навички для розгортання та підтримки систем ML у масштабі.

Передумови

Перед початком цього треку:

Теорія спостережуваності — основи моніторингу
Базові концепції машинного навчання (навчання, ініференс, моделі)
Досвід програмування на Python
Розуміння концепцій CI/CD
Основи Kubernetes (корисно, але не обов’язково)

Модулі

#	Модуль	Складність	Час
5.1	Основи MLOps	`[MEDIUM]`	35-40 хв
5.2	Feature Engineering та Feature Stores	`[COMPLEX]`	40-45 хв
5.3	Навчання моделей та експериментування	`[COMPLEX]`	40-45 хв
5.4	Обслуговування моделей та ініференс	`[COMPLEX]`	40-45 хв
5.5	Моніторинг моделей та спостережуваність	`[COMPLEX]`	40-45 хв
5.6	ML конвеєри та автоматизація	`[COMPLEX]`	40-45 хв

Результати навчання

Після завершення цього треку ви зможете:

Розуміти рівні зрілості MLOps — від ноутбуків до автоматизованих конвеєрів
Будувати feature stores — забезпечувати узгодженість між навчанням та обслуговуванням
Відстежувати експерименти — відтворювати результати, систематично порівнювати підходи
Розгортати моделі — KServe, канаркові розгортання, A/B тестування
Моніторити системи ML — виявляти дрейф даних, відстежувати продуктивність без міток
Автоматизувати конвеєри — Kubeflow, безперервне навчання, CI/CD для ML

Ключові концепції

Життєвий цикл ML

┌─────────────────────────────────────────────────────────────────┐
│                      ЖИТТЄВИЙ ЦИКЛ ML                           │
│                                                                  │
│  ДАНІ                 ЕКСПЕРИМЕНТУВАННЯ         ПРОДАКШН         │
│  ┌──────────┐        ┌──────────┐            ┌──────────┐       │
│  │ Прийом   │        │ Навчання │            │ Обслуго- │       │
│  │ даних    │───────▶│ моделі   │────────────▶│ вування  │       │
│  └────┬─────┘        └────┬─────┘            └────┬─────┘       │
│       │                   │                       │              │
│  ┌────▼─────┐        ┌────▼─────┐            ┌────▼─────┐       │
│  │Валідація │        │Валідація │            │Моніторинг│       │
│  │даних     │        │моделі    │            │          │       │
│  └────┬─────┘        └────┬─────┘            └────┬─────┘       │
│       │                   │                       │              │
│  ┌────▼─────┐        ┌────▼─────┐            ┌────▼─────┐       │
│  │ Feature  │        │ Реєстр   │            │ Тригер   │       │
│  │ Store    │        │ моделей  │            │ довчання │◀──────┘
│  └──────────┘        └──────────┘            └──────────┘       │
│                                                                  │
└─────────────────────────────────────────────────────────────────┘

Основні принципи

Відтворюваність — кожен запуск навчання має бути відтворюваним
Автоматизація — автоматизуйте все: від навчання до розгортання
Версіонування — версіонуйте код, дані ТА моделі
Моніторинг — системи ML виходять з ладу непомітно; моніторте все
Безперервне навчання — моделі деградують; підтримуйте їх актуальність

MLOps vs DevOps

Аспект	DevOps	MLOps
Артефакт	Код	Код + Дані + Модель
Тестування	Unit, інтеграційні	+ Валідація моделі, тести дрейфу
Версіонування	Git	Git + DVC/MLflow
Моніторинг	Інфраструктура	+ Якість даних, точність моделі
CI/CD	Build, test, deploy	+ Train, validate, serve

Охоплені інструменти

Категорія	Інструменти
Відстеження експериментів	MLflow, Weights & Biases, Neptune
Feature Stores	Feast, Tecton, Hopsworks
Обслуговування моделей	KServe, Seldon Core, BentoML, TorchServe
Оркестрація конвеєрів	Kubeflow Pipelines, Apache Airflow, Argo
Моніторинг	Evidently, WhyLabs, Arize, NannyML
Налаштування гіперпараметрів	Optuna, Katib, Ray Tune
Платформи	Kubeflow, SageMaker, Vertex AI, Databricks

Шлях вивчення

Модуль 5.1: Основи MLOps
     │
     │  Чому ML відрізняється, рівні зрілості
     ▼
Модуль 5.2: Feature Engineering та Feature Stores
     │
     │  Training/serving skew, Feast
     ▼
Модуль 5.3: Навчання моделей та експериментування
     │
     │  MLflow, HPO, відтворюваність
     ▼
Модуль 5.4: Обслуговування моделей та ініференс
     │
     │  KServe, патерни розгортання
     ▼
Модуль 5.5: Моніторинг моделей та спостережуваність
     │
     │  Детекція дрейфу, Evidently
     ▼
Модуль 5.6: ML конвеєри та автоматизація
     │
     │  Kubeflow, CI/CD для ML
     ▼
[Трек завершено] → Набір інструментів ML Platforms

Пов’язані треки

До: Теорія спостережуваності — основи моніторингу
Пов’язано: Дисципліна IaC — підготовка інфраструктури для ML
Пов’язано: DevSecOps — безпека конвеєрів ML
Після: Набір інструментів ML Platforms — практичне впровадження
Після: Набір інструментів IaC — модулі Terraform для ML

“Модель гарна лише настільки, наскільки гарна система, що її обслуговує. MLOps — це і є ця система.”