Дисципліна Chaos Engineering
Проактивне впровадження відмов для побудови стійких систем.
Chaos Engineering — це не про “створення хаосу”, а про “виявлення хаосу”, який вже існує у ваших складних системах. Замість того, щоб чекати збою в 3 годині ночі, ви проводите контрольовані експерименти, щоб зрозуміти, як ваша інфраструктура та додатки реагують на стрес.
Модулі
Розділ «Модулі»| # | Модуль | Час | Що ви вивчите |
|---|---|---|---|
| 1.1 | Принципи хаос-інженерії | 2 год | Сталий стан, гіпотези, радіус ураження, планування експерименту |
| 1.2 | Хаос у Kubernetes | 2.5 год | Видалення подів, відмови вузлів, API стрес, затримки мережі |
| 1.3 | Інструменти: Chaos Mesh та Litmus | 3 год | Встановлення, Custom Resources для хаосу, автоматизація експериментів |
| 1.4 | Обсервабельність під час хаосу | 2.5 год | Dashboarding під час атаки, виявлення дрейфу SLO, Game Days |
| 1.5 | Корпоративний хаос та Game Days | 2 год | Організація командних навчань, психологічна безпека, RCA |
Загальний час: ~12 годин
Передумови
Розділ «Передумови»- Надійність інженерних систем — теорія відмов
- Дисципліна SRE — розуміння SLO та бюджетів помилок
- Базові знання Kubernetes (Pods, Nodes, Services)
Що далі
Розділ «Що далі»Після Chaos Engineering переходьте до DevSecOps — щоб забезпечити безпеку та відповідність ваших систем навіть під час збоїв.