Набір інструментів ML-платформ

Трек інструментів | 6 модулів | ~5 годин загалом

Огляд

Набір інструментів ML-платформ (ML Platforms Toolkit) охоплює інфраструктуру для промислового машинного навчання на Kubernetes. Від традиційних конвеєрів ML з Kubeflow та MLflow до революції LLM з vLLM та LangChain — цей набір надає повний фундамент для сучасної інфраструктури AI/ML. Незалежно від того, чи ви запускаєте пакетне навчання, обслуговуєте прогнози в реальному часі чи будуєте RAG-додатки, ці інструменти формують хребет промислових AI-систем.

Цей набір застосовує концепції з Дисципліни MLOps.

Передумови

Перед початком цього треку:

Дисципліна MLOps
Основи Kubernetes
Базові концепції ML (навчання, ініференс)
Володіння Python

Модулі

#	Модуль	Складність	Час
9.1	Kubeflow	`[COMPLEX]`	50-60 хв
9.2	MLflow	`[MEDIUM]`	40-45 хв
9.3	Feature Stores	`[MEDIUM]`	40-45 хв
9.4	vLLM	`[COMPLEX]`	50-60 хв
9.5	Ray Serve	`[COMPLEX]`	50-60 хв
9.6	LangChain & LlamaIndex	`[COMPLEX]`	50-60 хв
9.7	Планування GPU	`[COMPLEX]`	50 хв

Результати навчання

Після завершення цього треку ви зможете:

Розгортати Kubeflow — конвеєри (pipelines), ноутбуки, обслуговування моделей
Відстежувати експерименти — MLflow tracking та реєстр моделей
Керувати ознаками (features) — Feast offline та online сховища
Ефективно обслуговувати LLM — vLLM з PagedAttention для високої пропускної здатності
Будувати розподілений ініференс — Ray Serve для багатомодельних конвеєрів
Створювати RAG-додатки — LangChain та LlamaIndex для додатків на базі LLM

Гід з вибору інструментів

ЯКИЙ ІНСТРУМЕНТ ML-ПЛАТФОРМИ ОБРАТИ?
─────────────────────────────────────────────────────────────────

"Мені потрібно оркеструвати конвеєри навчання ML"
└──▶ Kubeflow Pipelines
     • Оркестрація воркфлоу
     • Управління артефактами
     • Kubernetes-native
     • Планування GPU

"Мені потрібно відстежувати експерименти та моделі"
└──▶ MLflow
     • Логування параметрів/метрик
     • Версіонування моделей
     • Реєстр моделей
     • Агностичний до фреймворків

"Мені потрібно керувати ознаками та обслуговувати їх"
└──▶ Feast
     • Визначення ознак (features)
     • Коректність даних на момент часу (point-in-time)
     • Online/offline сховища
     • Узгодженість навчання та обслуговування

"Мені потрібно обслуговувати LLM з високою швидкістю"
└──▶ vLLM
     • Оптимізація пам'яті PagedAttention
     • Continuous batching
     • OpenAI-сумісний API
     • Паралелізм тензорів на кількох GPU

"Мені потрібен розподілений ініференс"
└──▶ Ray Serve
     • Композиція моделей
     • Дробове виділення GPU (fractional allocation)
     • Автомасштабування
     • Вбудоване A/B тестування

"Мені потрібно будувати додатки на базі LLM"
└──▶ LangChain / LlamaIndex
     • RAG (Retrieval-Augmented Generation)
     • Ланцюжки та агенти
     • Управління пам'яттю
     • Обробка документів

Шлях вивчення

Модуль 9.1: Kubeflow
     │
     │  Фундамент ML-платформи
     │  Pipelines, ноутбуки, навчання
     ▼
Модуль 9.2: MLflow
     │
     │  Відстеження експериментів
     │  Реєстр моделей
     ▼
Модуль 9.3: Feature Stores
     │
     │  Управління ознаками
     │  Узгодженість навчання та обслуговування
     ▼
Модуль 9.4: vLLM
     │
     │  Високошвидкісне обслуговування LLM
     │  Оптимізація PagedAttention
     ▼
Модуль 9.5: Ray Serve
     │
     │  Розподілений ініференс
     │  Композиція моделей
     ▼
Модуль 9.6: LangChain & LlamaIndex
     │
     │  Фреймворки для LLM-додатків
     │  RAG та агенти
     ▼
[Набір завершено] → Продакшн AI/ML!

Пов’язані треки

До: Дисципліна MLOps — концепції та практики MLOps
Пов’язано: Дисципліна IaC — підготовка інфраструктури для ML
Пов’язано: Набір інструментів IaC — Terraform-модулі для ML інфраструктури
Пов’язано: Набір інструментів спостережуваності — моніторинг ML систем
Пов’язано: Набір інструментів GitOps — деплой ML інфраструктури
Пов’язано: Набір інструментів масштабування — масштабування ML навантажень

“Найкраща ML-платформа невидима для дата-саєнтистів. Вони фокусуються на моделях; платформа бере на себе все інше.”