Дисципліна MLOps
Прикладна дисципліна | 6 модулів | ~4 години загалом
Огляд
Розділ «Огляд»MLOps привносить інженерну суворість у машинне навчання. Більшість проєктів ML зазнають невдачі не через погані моделі, а через те, що команди не можуть перетворити їх на працюючий продукт. Дата-саєнтисти будують прототипи; MLOps перетворює їх на промислові системи.
Цей трек охоплює повний життєвий цикл ML — від відстеження експериментів та магазинів ознак (feature stores) до обслуговування моделей, моніторингу та автоматизованих конвеєрів — даючи вам навички для розгортання та підтримки систем ML у масштабі.
Передумови
Розділ «Передумови»Перед початком цього треку:
- Теорія спостережуваності — основи моніторингу
- Базові концепції машинного навчання (навчання, ініференс, моделі)
- Досвід програмування на Python
- Розуміння концепцій CI/CD
- Основи Kubernetes (корисно, але не обов’язково)
Модулі
Розділ «Модулі»| # | Модуль | Складність | Час |
|---|---|---|---|
| 5.1 | Основи MLOps | [MEDIUM] | 35-40 хв |
| 5.2 | Feature Engineering та Feature Stores | [COMPLEX] | 40-45 хв |
| 5.3 | Навчання моделей та експериментування | [COMPLEX] | 40-45 хв |
| 5.4 | Обслуговування моделей та ініференс | [COMPLEX] | 40-45 хв |
| 5.5 | Моніторинг моделей та спостережуваність | [COMPLEX] | 40-45 хв |
| 5.6 | ML конвеєри та автоматизація | [COMPLEX] | 40-45 хв |
Результати навчання
Розділ «Результати навчання»Після завершення цього треку ви зможете:
- Розуміти рівні зрілості MLOps — від ноутбуків до автоматизованих конвеєрів
- Будувати feature stores — забезпечувати узгодженість між навчанням та обслуговуванням
- Відстежувати експерименти — відтворювати результати, систематично порівнювати підходи
- Розгортати моделі — KServe, канаркові розгортання, A/B тестування
- Моніторити системи ML — виявляти дрейф даних, відстежувати продуктивність без міток
- Автоматизувати конвеєри — Kubeflow, безперервне навчання, CI/CD для ML
Ключові концепції
Розділ «Ключові концепції»Життєвий цикл ML
Розділ «Життєвий цикл ML»┌─────────────────────────────────────────────────────────────────┐│ ЖИТТЄВИЙ ЦИКЛ ML ││ ││ ДАНІ ЕКСПЕРИМЕНТУВАННЯ ПРОДАКШН ││ ┌──────────┐ ┌──────────┐ ┌──────────┐ ││ │ Прийом │ │ Навчання │ │ Обслуго- │ ││ │ даних │───────▶│ моделі │────────────▶│ вування │ ││ └────┬─────┘ └────┬─────┘ └────┬─────┘ ││ │ │ │ ││ ┌────▼─────┐ ┌────▼─────┐ ┌────▼─────┐ ││ │Валідація │ │Валідація │ │Моніторинг│ ││ │даних │ │моделі │ │ │ ││ └────┬─────┘ └────┬─────┘ └────┬─────┘ ││ │ │ │ ││ ┌────▼─────┐ ┌────▼─────┐ ┌────▼─────┐ ││ │ Feature │ │ Реєстр │ │ Тригер │ ││ │ Store │ │ моделей │ │ довчання │◀──────┘│ └──────────┘ └──────────┘ └──────────┘ ││ │└─────────────────────────────────────────────────────────────────┘Основні принципи
Розділ «Основні принципи»- Відтворюваність — кожен запуск навчання має бути відтворюваним
- Автоматизація — автоматизуйте все: від навчання до розгортання
- Версіонування — версіонуйте код, дані ТА моделі
- Моніторинг — системи ML виходять з ладу непомітно; моніторте все
- Безперервне навчання — моделі деградують; підтримуйте їх актуальність
MLOps vs DevOps
Розділ «MLOps vs DevOps»| Аспект | DevOps | MLOps |
|---|---|---|
| Артефакт | Код | Код + Дані + Модель |
| Тестування | Unit, інтеграційні | + Валідація моделі, тести дрейфу |
| Версіонування | Git | Git + DVC/MLflow |
| Моніторинг | Інфраструктура | + Якість даних, точність моделі |
| CI/CD | Build, test, deploy | + Train, validate, serve |
Охоплені інструменти
Розділ «Охоплені інструменти»| Категорія | Інструменти |
|---|---|
| Відстеження експериментів | MLflow, Weights & Biases, Neptune |
| Feature Stores | Feast, Tecton, Hopsworks |
| Обслуговування моделей | KServe, Seldon Core, BentoML, TorchServe |
| Оркестрація конвеєрів | Kubeflow Pipelines, Apache Airflow, Argo |
| Моніторинг | Evidently, WhyLabs, Arize, NannyML |
| Налаштування гіперпараметрів | Optuna, Katib, Ray Tune |
| Платформи | Kubeflow, SageMaker, Vertex AI, Databricks |
Шлях вивчення
Розділ «Шлях вивчення»Модуль 5.1: Основи MLOps │ │ Чому ML відрізняється, рівні зрілості ▼Модуль 5.2: Feature Engineering та Feature Stores │ │ Training/serving skew, Feast ▼Модуль 5.3: Навчання моделей та експериментування │ │ MLflow, HPO, відтворюваність ▼Модуль 5.4: Обслуговування моделей та ініференс │ │ KServe, патерни розгортання ▼Модуль 5.5: Моніторинг моделей та спостережуваність │ │ Детекція дрейфу, Evidently ▼Модуль 5.6: ML конвеєри та автоматизація │ │ Kubeflow, CI/CD для ML ▼[Трек завершено] → Набір інструментів ML PlatformsПов’язані треки
Розділ «Пов’язані треки»- До: Теорія спостережуваності — основи моніторингу
- Пов’язано: Дисципліна IaC — підготовка інфраструктури для ML
- Пов’язано: DevSecOps — безпека конвеєрів ML
- Після: Набір інструментів ML Platforms — практичне впровадження
- Після: Набір інструментів IaC — модулі Terraform для ML
“Модель гарна лише настільки, наскільки гарна система, що її обслуговує. MLOps — це і є ця система.”