Перейти до вмісту

Дисципліна Data Engineering на Kubernetes

Запуск інфраструктури даних на Kubernetes — бази даних, черги, потокова обробка та аналітика.

Data Engineering на Kubernetes фокусується на викликах запуску систем зі станом (stateful) у динамічному середовищі. Ця дисципліна охоплює архітектуру сховищ, оператори для баз даних, масштабування потокових платформ та управління життєвим циклом даних. Ви навчитеся перетворювати Kubernetes на надійну платформу для ваших даних.


#ModuleTimeWhat You’ll Learn
1.1Stateful на Kubernetes: Основи3 годPV/PVC, StorageClasses, StatefulSets, Local Persistence
1.2Оператори для баз даних4 годCloudNativePG, Zalando Postgres, PGO, MySQL Operator
1.3Стрімінг даних (Kafka на K8s)5 годStrimzi, партиціонування, вирівнювання навантаження, Quotas
1.4NoSQL та аналітичні БД4 годClickHouse (Altinity), MongoDB, Cassandra, Vector DBs
1.5Оркестрація та якість даних3 годAirflow на K8s, Spark on K8s, перевірки якості (Great Expectations)
1.6Бекап та відновлення даних3 годVelero, Kasten (K10), архітектура DR для даних

Загальний час: ~22 години


  • Адміністрування Kubernetes (рівень CKA)
  • Розуміння Kubernetes Storage (PV/PVC)
  • Базові знання SQL та архітектури баз даних