Перейти до вмісту

Набір інструментів ML-платформ

Трек інструментів | 6 модулів | ~5 годин загалом

Набір інструментів ML-платформ (ML Platforms Toolkit) охоплює інфраструктуру для промислового машинного навчання на Kubernetes. Від традиційних конвеєрів ML з Kubeflow та MLflow до революції LLM з vLLM та LangChain — цей набір надає повний фундамент для сучасної інфраструктури AI/ML. Незалежно від того, чи ви запускаєте пакетне навчання, обслуговуєте прогнози в реальному часі чи будуєте RAG-додатки, ці інструменти формують хребет промислових AI-систем.

Цей набір застосовує концепції з Дисципліни MLOps.

Перед початком цього треку:

  • Дисципліна MLOps
  • Основи Kubernetes
  • Базові концепції ML (навчання, ініференс)
  • Володіння Python
#МодульСкладністьЧас
9.1Kubeflow[COMPLEX]50-60 хв
9.2MLflow[MEDIUM]40-45 хв
9.3Feature Stores[MEDIUM]40-45 хв
9.4vLLM[COMPLEX]50-60 хв
9.5Ray Serve[COMPLEX]50-60 хв
9.6LangChain & LlamaIndex[COMPLEX]50-60 хв
9.7Планування GPU[COMPLEX]50 хв

Результати навчання

Розділ «Результати навчання»

Після завершення цього треку ви зможете:

  1. Розгортати Kubeflow — конвеєри (pipelines), ноутбуки, обслуговування моделей
  2. Відстежувати експерименти — MLflow tracking та реєстр моделей
  3. Керувати ознаками (features) — Feast offline та online сховища
  4. Ефективно обслуговувати LLM — vLLM з PagedAttention для високої пропускної здатності
  5. Будувати розподілений ініференс — Ray Serve для багатомодельних конвеєрів
  6. Створювати RAG-додатки — LangChain та LlamaIndex для додатків на базі LLM

Гід з вибору інструментів

Розділ «Гід з вибору інструментів»
ЯКИЙ ІНСТРУМЕНТ ML-ПЛАТФОРМИ ОБРАТИ?
─────────────────────────────────────────────────────────────────
"Мені потрібно оркеструвати конвеєри навчання ML"
└──▶ Kubeflow Pipelines
• Оркестрація воркфлоу
• Управління артефактами
• Kubernetes-native
• Планування GPU
"Мені потрібно відстежувати експерименти та моделі"
└──▶ MLflow
• Логування параметрів/метрик
• Версіонування моделей
• Реєстр моделей
• Агностичний до фреймворків
"Мені потрібно керувати ознаками та обслуговувати їх"
└──▶ Feast
• Визначення ознак (features)
• Коректність даних на момент часу (point-in-time)
• Online/offline сховища
• Узгодженість навчання та обслуговування
"Мені потрібно обслуговувати LLM з високою швидкістю"
└──▶ vLLM
• Оптимізація пам'яті PagedAttention
• Continuous batching
• OpenAI-сумісний API
• Паралелізм тензорів на кількох GPU
"Мені потрібен розподілений ініференс"
└──▶ Ray Serve
• Композиція моделей
• Дробове виділення GPU (fractional allocation)
• Автомасштабування
• Вбудоване A/B тестування
"Мені потрібно будувати додатки на базі LLM"
└──▶ LangChain / LlamaIndex
• RAG (Retrieval-Augmented Generation)
• Ланцюжки та агенти
• Управління пам'яттю
• Обробка документів
Модуль 9.1: Kubeflow
│ Фундамент ML-платформи
│ Pipelines, ноутбуки, навчання
Модуль 9.2: MLflow
│ Відстеження експериментів
│ Реєстр моделей
Модуль 9.3: Feature Stores
│ Управління ознаками
│ Узгодженість навчання та обслуговування
Модуль 9.4: vLLM
│ Високошвидкісне обслуговування LLM
│ Оптимізація PagedAttention
Модуль 9.5: Ray Serve
│ Розподілений ініференс
│ Композиція моделей
Модуль 9.6: LangChain & LlamaIndex
│ Фреймворки для LLM-додатків
│ RAG та агенти
[Набір завершено] → Продакшн AI/ML!

“Найкраща ML-платформа невидима для дата-саєнтистів. Вони фокусуються на моделях; платформа бере на себе все інше.”