Від адміністратора кластера до інженера платформи

Цей місток призначений для тих, хто має CKA, CKAD, CKS або рівноцінний досвід адміністрування кластерів і хоче перейти до інженерії платформ. Він закриває розрив між експлуатацією ресурсів Kubernetes та проєктуванням внутрішньої платформи як продукту — з цілями надійності, золотими шляхами, дисципліною GitOps, відповідальністю за сервіси, спостережуваністю та механікою впровадження.

Діагностика — чи ви готові?

Карта прогалин у навичках

Що ви маєте	Що вам потрібно	Де це вивчати
Вільне володіння об’єктами Kubernetes	Системне мислення в межах команд, сервісів і циклів зворотного зв’язку	Що таке системне мислення?
Усунення несправностей у кластері	Цілі надійності та рішення на основі бюджету помилок	Інженерія надійності
Використання метрик і логів	Спостережуваність як дисципліна проєктування	Теорія спостережуваності
Заходи безпеки	Принципи безпеки, вбудовані у стандартні налаштування платформи	Принципи безпеки
Адміністрування ресурсів	Відповідальність за сервіси та операційні моделі	SRE
Доставка YAML	Узгодження GitOps і контроль дрейфу	GitOps
Разова автоматизація	Багаторазові золоті шляхи та досвід розробника	Інженерія платформ
Знайомство з інструментами	Вибір інструментів на основі шляхів користувача та обмежень платформи	Набори інструментів платформи
Керування доступом	Робочі процеси для секретів і політик, які команди здатні впровадити	Vault
Розгортання застосунків	Патерни внутрішнього порталу розробника	Backstage

Послідовний маршрут

Почніть зі Що таке системне мислення?. Чому цей крок: робота з платформою — це про цикли зворотного зв’язку, стимули, обмеження та межі сервісів, а не лише про стан кластера.
Продовжте через Інженерію надійності. Чому цей крок: SLO, бюджети помилок і компроміси надійності — це мова, якою вирішують, що саме платформа має оптимізувати.
Вивчіть Теорію спостережуваності. Чому цей крок: командам платформи потрібно робити режими відмов видимими для команд сервісів, не перетворюючи кожного користувача на експерта зі спостережуваності.
Перейдіть до SRE. Чому цей крок: SRE поєднує цілі надійності, реагування на інциденти, зменшення рутини та операційну відповідальність.
Прочитайте Інженерію платформ. Чому цей крок: платформа стає внутрішнім продуктом тоді, коли в неї є користувачі, шляхи впровадження, цикли зворотного зв’язку та модель підтримки.
Вивчіть GitOps. Чому цей крок: дисципліна узгодження перетворює операції Kubernetes на придатну до рев’ю, відтворювану й аудитовану зміну системи.
Додайте Argo CD, коли вам знадобляться деталі реалізації. Чому цей крок: інструменти легше оцінювати, коли ви розумієте узгодження, відповідальність, просування та вимоги до відкату.
Додайте Backstage, коли будете готові проєктувати точки входу для розробників. Чому цей крок: внутрішній портал розробника корисний лише тоді, коли він відображає реальну відповідальність за сервіси та робочі процеси золотих шляхів.
Додайте Vault, коли секрети та ідентичність стають примітивами платформи. Чому цей крок: команди платформи повинні зробити безпечні стандартні налаштування простішими за небезпечні обхідні шляхи.

Антипатерни

Сприйняття інженерії платформ як просто «YAML у масштабі».
Побудова золотих шляхів, якими ніхто не користується, бо жоден робочий процес розробника не був попередньо виміряний.
Ігнорування даних про час циклу розробника й оптимізація лише чистоти кластера.
Ототожнення SRE з графіком чергувань на виклику.
Встановлення Backstage, Argo CD чи Vault до того, як визначено операційну модель, якій вони мають слугувати.
Створення API самообслуговування без відповідальності, підтримки, шляхів припинення підтримки та реагування на інциденти.

Як виглядає успіх

Ви можете описати користувачів платформи, їхні обмеження та роботу, яку вони намагаються завершити.
Ви можете визначити золотий шлях зі стандартними налаштуваннями, аварійними виходами, документацією та межами підтримки.
Ви можете використовувати SLO та бюджети помилок для пріоритезації роботи над платформою.
Ви можете виявити рутину й вирішити, чи її автоматизувати, задокументувати, делегувати або прибрати.
Ви можете пояснити, як GitOps зменшує дрейф і покращує придатність до рев’ю.
Ви можете оцінювати інструменти за впровадженням, зручністю експлуатації та впливом на надійність, а не за переліком функцій.

Перший модуль для читання

Почніть зі Що таке системне мислення?.