Набір інструментів ML-платформ
Трек інструментів | 6 модулів | ~5 годин загалом
Огляд
Розділ «Огляд»Набір інструментів ML-платформ (ML Platforms Toolkit) охоплює інфраструктуру для промислового машинного навчання на Kubernetes. Від традиційних конвеєрів ML з Kubeflow та MLflow до революції LLM з vLLM та LangChain — цей набір надає повний фундамент для сучасної інфраструктури AI/ML. Незалежно від того, чи ви запускаєте пакетне навчання, обслуговуєте прогнози в реальному часі чи будуєте RAG-додатки, ці інструменти формують хребет промислових AI-систем.
Цей набір застосовує концепції з Дисципліни MLOps.
Передумови
Розділ «Передумови»Перед початком цього треку:
- Дисципліна MLOps
- Основи Kubernetes
- Базові концепції ML (навчання, ініференс)
- Володіння Python
Модулі
Розділ «Модулі»| # | Модуль | Складність | Час |
|---|---|---|---|
| 9.1 | Kubeflow | [COMPLEX] | 50-60 хв |
| 9.2 | MLflow | [MEDIUM] | 40-45 хв |
| 9.3 | Feature Stores | [MEDIUM] | 40-45 хв |
| 9.4 | vLLM | [COMPLEX] | 50-60 хв |
| 9.5 | Ray Serve | [COMPLEX] | 50-60 хв |
| 9.6 | LangChain & LlamaIndex | [COMPLEX] | 50-60 хв |
| 9.7 | Планування GPU | [COMPLEX] | 50 хв |
Результати навчання
Розділ «Результати навчання»Після завершення цього треку ви зможете:
- Розгортати Kubeflow — конвеєри (pipelines), ноутбуки, обслуговування моделей
- Відстежувати експерименти — MLflow tracking та реєстр моделей
- Керувати ознаками (features) — Feast offline та online сховища
- Ефективно обслуговувати LLM — vLLM з PagedAttention для високої пропускної здатності
- Будувати розподілений ініференс — Ray Serve для багатомодельних конвеєрів
- Створювати RAG-додатки — LangChain та LlamaIndex для додатків на базі LLM
Гід з вибору інструментів
Розділ «Гід з вибору інструментів»ЯКИЙ ІНСТРУМЕНТ ML-ПЛАТФОРМИ ОБРАТИ?─────────────────────────────────────────────────────────────────
"Мені потрібно оркеструвати конвеєри навчання ML"└──▶ Kubeflow Pipelines • Оркестрація воркфлоу • Управління артефактами • Kubernetes-native • Планування GPU
"Мені потрібно відстежувати експерименти та моделі"└──▶ MLflow • Логування параметрів/метрик • Версіонування моделей • Реєстр моделей • Агностичний до фреймворків
"Мені потрібно керувати ознаками та обслуговувати їх"└──▶ Feast • Визначення ознак (features) • Коректність даних на момент часу (point-in-time) • Online/offline сховища • Узгодженість навчання та обслуговування
"Мені потрібно обслуговувати LLM з високою швидкістю"└──▶ vLLM • Оптимізація пам'яті PagedAttention • Continuous batching • OpenAI-сумісний API • Паралелізм тензорів на кількох GPU
"Мені потрібен розподілений ініференс"└──▶ Ray Serve • Композиція моделей • Дробове виділення GPU (fractional allocation) • Автомасштабування • Вбудоване A/B тестування
"Мені потрібно будувати додатки на базі LLM"└──▶ LangChain / LlamaIndex • RAG (Retrieval-Augmented Generation) • Ланцюжки та агенти • Управління пам'яттю • Обробка документівШлях вивчення
Розділ «Шлях вивчення»Модуль 9.1: Kubeflow │ │ Фундамент ML-платформи │ Pipelines, ноутбуки, навчання ▼Модуль 9.2: MLflow │ │ Відстеження експериментів │ Реєстр моделей ▼Модуль 9.3: Feature Stores │ │ Управління ознаками │ Узгодженість навчання та обслуговування ▼Модуль 9.4: vLLM │ │ Високошвидкісне обслуговування LLM │ Оптимізація PagedAttention ▼Модуль 9.5: Ray Serve │ │ Розподілений ініференс │ Композиція моделей ▼Модуль 9.6: LangChain & LlamaIndex │ │ Фреймворки для LLM-додатків │ RAG та агенти ▼[Набір завершено] → Продакшн AI/ML!Пов’язані треки
Розділ «Пов’язані треки»- До: Дисципліна MLOps — концепції та практики MLOps
- Пов’язано: Дисципліна IaC — підготовка інфраструктури для ML
- Пов’язано: Набір інструментів IaC — Terraform-модулі для ML інфраструктури
- Пов’язано: Набір інструментів спостережуваності — моніторинг ML систем
- Пов’язано: Набір інструментів GitOps — деплой ML інфраструктури
- Пов’язано: Набір інструментів масштабування — масштабування ML навантажень
“Найкраща ML-платформа невидима для дата-саєнтистів. Вони фокусуються на моделях; платформа бере на себе все інше.”