Набір інструментів AIOps
Трек інструментів | 4 модулі | ~3 години загалом
Огляд
Розділ «Огляд»Набір інструментів AIOps (AIOps Tools Toolkit) охоплює практичне впровадження можливостей AIOps — від open-source бібліотек для виявлення аномалій до корпоративних платформ кореляції подій. Ви дізнаєтеся, коли використовувати Prophet vs. Isolation Forest, як працюють комерційні платформи типу BigPanda та Moogsoft, і як будувати власні AIOps-конвеєри на Kubernetes.
Цей набір застосовує концепції з Дисципліни AIOps.
Передумови
Розділ «Передумови»Перед початком цього треку:
- Дисципліна AIOps — пройдіть концептуальний фундамент
- Набір інструментів спостережуваності — рівень збору даних
- Володіння Python для вправ з виявлення аномалій
- Основи Kubernetes для вправ з побудови власних конвеєрів
Модулі
Розділ «Модулі»| # | Модуль | Складність | Час |
|---|---|---|---|
| 10.1 | Інструменти виявлення аномалій | [MEDIUM] | 40-45 хв |
| 10.2 | Платформи кореляції подій | [MEDIUM] | 40-45 хв |
| 10.3 | AI-функції у спостережуваності | [MEDIUM] | 40-45 хв |
| 10.4 | Побудова власного AIOps | [COMPLEX] | 50-60 хв |
Результати навчання
Розділ «Результати навчання»Після завершення цього треку ви зможете:
- Обирати інструменти виявлення аномалій — Prophet, Luminaire, PyOD для різних кейсів
- Оцінювати платформи кореляції — BigPanda, Moogsoft, PagerDuty AIOps
- Використовувати AI у моніторингу — Datadog Watchdog, Dynatrace Davis, New Relic AI
- Будувати власні конвеєри — Python + Kafka + Kubernetes для кастомного AIOps
Гід з вибору інструментів
Розділ «Гід з вибору інструментів»ЯКИЙ ІНСТРУМЕНТ AIOPS ОБРАТИ?─────────────────────────────────────────────────────────────────
"Мені потрібна детекція аномалій у часових рядах із сезонністю"└──▶ Prophet (Facebook) • Обробляє кілька видів сезонності • Детекція трендів • Вплив святкових днів • Гарний для прогнозування
"Мені потрібна швидка детекція аномалій у потоці даних"└──▶ Luminaire (Zillow) • Детекція в реальному часі • Мінімальна конфігурація • Обробка структурних змін • Нативний для Python
"Мені потрібна багатовимірна детекція аномалій"└──▶ PyOD / Isolation Forest • Робота з багатовимірними даними • Багато алгоритмів в одному • Сумісний зі Scikit-learn • Гарний для спільного аналізу логів та метрик
"Мені потрібна корпоративна кореляція подій"└──▶ BigPanda / Moogsoft • Кореляція з урахуванням топології • Групування на основі ML • Екосистема інтеграцій • Управління SLA
"Мені потрібен AI, вбудований у платформу моніторингу"└──▶ Datadog Watchdog / Dynatrace Davis • Без додаткового налаштування • Корелює з метриками/трасами • Автоматичне базове моделювання (baselining) • Пропозиції щодо кореневих причин (RCA)
"Мені потрібен кастомний AIOps під унікальні вимоги"└──▶ Побудова на Python + Kafka + K8s • Повний контроль • Специфічні для домену моделі • Дані залишаються всередині компанії • Високі інвестиції в інженеріюЛандшафт інструментів AIOps
Розділ «Ландшафт інструментів AIOps»┌─────────────────────────────────────────────────────────────────┐│ ЛАНДШАФТ ІНСТРУМЕНТІВ AIOPS │├─────────────────────────────────────────────────────────────────┤│ ││ OPEN SOURCE / БІБЛІОТЕКИ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ │ ││ │ ДЕТЕКЦІЯ АНОМАЛІЙ ЧАСОВІ РЯДИ ML TOOLKITS │ ││ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ ││ │ │ PyOD │ │ Prophet │ │Scikit- │ │ ││ │ │ (lib) │ │(Facebook│ │learn │ │ ││ │ └─────────┘ └─────────┘ └─────────┘ │ ││ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ ││ │ │Luminaire│ │ Kats │ │ PyTorch │ │ ││ │ │(Zillow) │ │(Facebook│ │LSTM etc.│ │ ││ │ └─────────┘ └─────────┘ └─────────┘ │ ││ │ │ ││ └───────────────────────────────────────────────────────────┘ ││ ││ ПЛАТФОРМИ КОРЕЛЯЦІЇ ПОДІЙ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ │ ││ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ ││ │ │BigPanda │ │Moogsoft │ │PagerDuty│ │ServiceNow │ ││ │ │ │ │ │ │ AIOps │ │ ITOM │ │ ││ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ ││ │ │ ││ └───────────────────────────────────────────────────────────┘ ││ ││ AI У ПЛАТФОРМАХ СПОСТЕРЕЖУВАНОСТІ ││ ┌───────────────────────────────────────────────────────────┐ ││ │ │ ││ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ ││ │ │ Datadog │ │Dynatrace│ │New Relic│ │ Splunk │ │ ││ │ │Watchdog │ │ Davis │ │ AI │ │ ITSI │ │ ││ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ ││ │ │ ││ └───────────────────────────────────────────────────────────┘ ││ ││ ОБРОБКА ПОТОКІВ (Для кастомних рішень) ││ ┌───────────────────────────────────────────────────────────┐ ││ │ │ ││ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ ││ │ │ Kafka │ │ Flink │ │ Spark │ │ Beam │ │ ││ │ │Streams │ │ │ │Streaming│ │ │ │ ││ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ ││ │ │ ││ └───────────────────────────────────────────────────────────┘ ││ │└─────────────────────────────────────────────────────────────────┘Коли будувати, а коли купувати
Розділ «Коли будувати, а коли купувати»| Фактор | Побудувати власне | Купити платформу |
|---|---|---|
| Час до цінності | Місяці | Дні/Тижні |
| Кастомізація | Необмежена | Обмежена |
| Підтримка | Ваша команда | Вендор |
| Контроль даних | Повний | Залежить від вендора |
| Інтеграція | Будь-яка | Екосистема |
| Модель витрат | Час інженерів | Ліцензія + використання |
| Найкраще для | Унікальні вимоги | Стандартні операції |
Рекомендація: Починайте з платформи (Datadog, PagerDuty), будуйте власні компоненти тільки для унікальних доменних вимог.
Шлях вивчення
Розділ «Шлях вивчення»Модуль 10.1: Інструменти виявлення аномалій │ │ Prophet, Luminaire, PyOD │ Коли що використовувати ▼Модуль 10.2: Платформи кореляції подій │ │ BigPanda, Moogsoft, PagerDuty │ Корпоративні можливості ▼Модуль 10.3: AI-функції у спостережуваності │ │ Вбудований AI у платформах моніторингу │ Datadog, Dynatrace, New Relic ▼Модуль 10.4: Побудова власного AIOps │ │ Python + Kafka + Kubernetes │ End-to-end кастомний конвеєр ▼[Набір завершено] → Продакшн AIOps!Архітектура інтеграції
Розділ «Архітектура інтеграції»АРХІТЕКТУРА ІНТЕГРОВАНОГО AIOPS─────────────────────────────────────────────────────────────────
ДЖЕРЕЛА ДАНИХ┌─────────┬─────────┬─────────┬─────────┬─────────┐│ Метрики │ Логи │ Траси │ Події │ Зміни │└────┬────┴────┬────┴────┬────┴────┬────┴────┬────┘ │ │ │ │ │ └─────────┴─────────┴─────────┴─────────┘ │ЗБІР ▼ ┌─────────────────────┐ │ Стек спостережуван. │ │ (Prometheus, OTel) │ └──────────┬──────────┘ │АНАЛІЗ ▼ ┌─────────────────────┐ │ Платформа AIOps │ │ ┌──────┬──────┐ │ │ │Детекц│Кореля│ │ │ │аномал│ ція │ │ │ └──────┴──────┘ │ │ ┌──────┬──────┐ │ │ │ RCA │Predict│ │ │ │Engine│ Ops │ │ │ └──────┴──────┘ │ └──────────┬──────────┘ │ДІЯ ▼ ┌─────────────────────┐ │ Виправлення │ │ (Авто/Ручне) │ └─────────────────────┘Пов’язані треки
Розділ «Пов’язані треки»- До: Дисципліна AIOps — концептуальний фундамент
- Пов’язано: Набір інструментів IaC — модулі Terraform для AIOps інфраструктури
- Пов’язано: Набір інструментів спостережуваності — рівень збору даних
- Пов’язано: Дисципліна SRE — операційні практики
- Після: Побудуйте продакшн AIOps!
“Найкращий інструмент AIOps — той, який ваша команда справді буде використовувати. Почніть з простого, доведіть цінність, а потім розширюйтеся.”