Перейти до вмісту

Набір інструментів AIOps

Трек інструментів | 4 модулі | ~3 години загалом

Набір інструментів AIOps (AIOps Tools Toolkit) охоплює практичне впровадження можливостей AIOps — від open-source бібліотек для виявлення аномалій до корпоративних платформ кореляції подій. Ви дізнаєтеся, коли використовувати Prophet vs. Isolation Forest, як працюють комерційні платформи типу BigPanda та Moogsoft, і як будувати власні AIOps-конвеєри на Kubernetes.

Цей набір застосовує концепції з Дисципліни AIOps.

Перед початком цього треку:

#МодульСкладністьЧас
10.1Інструменти виявлення аномалій[MEDIUM]40-45 хв
10.2Платформи кореляції подій[MEDIUM]40-45 хв
10.3AI-функції у спостережуваності[MEDIUM]40-45 хв
10.4Побудова власного AIOps[COMPLEX]50-60 хв

Результати навчання

Розділ «Результати навчання»

Після завершення цього треку ви зможете:

  1. Обирати інструменти виявлення аномалій — Prophet, Luminaire, PyOD для різних кейсів
  2. Оцінювати платформи кореляції — BigPanda, Moogsoft, PagerDuty AIOps
  3. Використовувати AI у моніторингу — Datadog Watchdog, Dynatrace Davis, New Relic AI
  4. Будувати власні конвеєри — Python + Kafka + Kubernetes для кастомного AIOps

Гід з вибору інструментів

Розділ «Гід з вибору інструментів»
ЯКИЙ ІНСТРУМЕНТ AIOPS ОБРАТИ?
─────────────────────────────────────────────────────────────────
"Мені потрібна детекція аномалій у часових рядах із сезонністю"
└──▶ Prophet (Facebook)
• Обробляє кілька видів сезонності
• Детекція трендів
• Вплив святкових днів
• Гарний для прогнозування
"Мені потрібна швидка детекція аномалій у потоці даних"
└──▶ Luminaire (Zillow)
• Детекція в реальному часі
• Мінімальна конфігурація
• Обробка структурних змін
• Нативний для Python
"Мені потрібна багатовимірна детекція аномалій"
└──▶ PyOD / Isolation Forest
• Робота з багатовимірними даними
• Багато алгоритмів в одному
• Сумісний зі Scikit-learn
• Гарний для спільного аналізу логів та метрик
"Мені потрібна корпоративна кореляція подій"
└──▶ BigPanda / Moogsoft
• Кореляція з урахуванням топології
• Групування на основі ML
• Екосистема інтеграцій
• Управління SLA
"Мені потрібен AI, вбудований у платформу моніторингу"
└──▶ Datadog Watchdog / Dynatrace Davis
• Без додаткового налаштування
• Корелює з метриками/трасами
• Автоматичне базове моделювання (baselining)
• Пропозиції щодо кореневих причин (RCA)
"Мені потрібен кастомний AIOps під унікальні вимоги"
└──▶ Побудова на Python + Kafka + K8s
• Повний контроль
• Специфічні для домену моделі
• Дані залишаються всередині компанії
• Високі інвестиції в інженерію

Ландшафт інструментів AIOps

Розділ «Ландшафт інструментів AIOps»
┌─────────────────────────────────────────────────────────────────┐
│ ЛАНДШАФТ ІНСТРУМЕНТІВ AIOPS │
├─────────────────────────────────────────────────────────────────┤
│ │
│ OPEN SOURCE / БІБЛІОТЕКИ │
│ ┌───────────────────────────────────────────────────────────┐ │
│ │ │ │
│ │ ДЕТЕКЦІЯ АНОМАЛІЙ ЧАСОВІ РЯДИ ML TOOLKITS │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │ PyOD │ │ Prophet │ │Scikit- │ │ │
│ │ │ (lib) │ │(Facebook│ │learn │ │ │
│ │ └─────────┘ └─────────┘ └─────────┘ │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │Luminaire│ │ Kats │ │ PyTorch │ │ │
│ │ │(Zillow) │ │(Facebook│ │LSTM etc.│ │ │
│ │ └─────────┘ └─────────┘ └─────────┘ │ │
│ │ │ │
│ └───────────────────────────────────────────────────────────┘ │
│ │
│ ПЛАТФОРМИ КОРЕЛЯЦІЇ ПОДІЙ │
│ ┌───────────────────────────────────────────────────────────┐ │
│ │ │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │BigPanda │ │Moogsoft │ │PagerDuty│ │ServiceNow │ │
│ │ │ │ │ │ │ AIOps │ │ ITOM │ │ │
│ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ │
│ │ │ │
│ └───────────────────────────────────────────────────────────┘ │
│ │
│ AI У ПЛАТФОРМАХ СПОСТЕРЕЖУВАНОСТІ │
│ ┌───────────────────────────────────────────────────────────┐ │
│ │ │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │ Datadog │ │Dynatrace│ │New Relic│ │ Splunk │ │ │
│ │ │Watchdog │ │ Davis │ │ AI │ │ ITSI │ │ │
│ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ │
│ │ │ │
│ └───────────────────────────────────────────────────────────┘ │
│ │
│ ОБРОБКА ПОТОКІВ (Для кастомних рішень) │
│ ┌───────────────────────────────────────────────────────────┐ │
│ │ │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │ Kafka │ │ Flink │ │ Spark │ │ Beam │ │ │
│ │ │Streams │ │ │ │Streaming│ │ │ │ │
│ │ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │ │
│ │ │ │
│ └───────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘

Коли будувати, а коли купувати

Розділ «Коли будувати, а коли купувати»
ФакторПобудувати власнеКупити платформу
Час до цінностіМісяціДні/Тижні
КастомізаціяНеобмеженаОбмежена
ПідтримкаВаша командаВендор
Контроль данихПовнийЗалежить від вендора
ІнтеграціяБудь-якаЕкосистема
Модель витратЧас інженерівЛіцензія + використання
Найкраще дляУнікальні вимогиСтандартні операції

Рекомендація: Починайте з платформи (Datadog, PagerDuty), будуйте власні компоненти тільки для унікальних доменних вимог.

Модуль 10.1: Інструменти виявлення аномалій
│ Prophet, Luminaire, PyOD
│ Коли що використовувати
Модуль 10.2: Платформи кореляції подій
│ BigPanda, Moogsoft, PagerDuty
│ Корпоративні можливості
Модуль 10.3: AI-функції у спостережуваності
│ Вбудований AI у платформах моніторингу
│ Datadog, Dynatrace, New Relic
Модуль 10.4: Побудова власного AIOps
│ Python + Kafka + Kubernetes
│ End-to-end кастомний конвеєр
[Набір завершено] → Продакшн AIOps!

Архітектура інтеграції

Розділ «Архітектура інтеграції»
АРХІТЕКТУРА ІНТЕГРОВАНОГО AIOPS
─────────────────────────────────────────────────────────────────
ДЖЕРЕЛА ДАНИХ
┌─────────┬─────────┬─────────┬─────────┬─────────┐
│ Метрики │ Логи │ Траси │ Події │ Зміни │
└────┬────┴────┬────┴────┬────┴────┬────┴────┬────┘
│ │ │ │ │
└─────────┴─────────┴─────────┴─────────┘
ЗБІР ▼
┌─────────────────────┐
│ Стек спостережуван. │
│ (Prometheus, OTel) │
└──────────┬──────────┘
АНАЛІЗ ▼
┌─────────────────────┐
│ Платформа AIOps │
│ ┌──────┬──────┐ │
│ │Детекц│Кореля│ │
│ │аномал│ ція │ │
│ └──────┴──────┘ │
│ ┌──────┬──────┐ │
│ │ RCA │Predict│ │
│ │Engine│ Ops │ │
│ └──────┴──────┘ │
└──────────┬──────────┘
ДІЯ ▼
┌─────────────────────┐
│ Виправлення │
│ (Авто/Ручне) │
└─────────────────────┘

“Найкращий інструмент AIOps — той, який ваша команда справді буде використовувати. Почніть з простого, доведіть цінність, а потім розширюйтеся.”