18 листопада 2025 року компанія Cloudflare зазнала одного з найбільших інцидентів у своїй історії, який назвали «найгіршим з 2019 року». Проблема сталася через помилку в системі Bot Management, що спричинило глобальний збій у роботі інтернету, пише WomanEL. Через це деякі популярні онлайн-сервіси, включаючи ChatGPT, X (раніше Twitter) та Downdetector, зазнали перебоїв у роботі.
Проблема виникла через некоректне налаштування запиту в базі даних ClickHouse, яка генерує конфігураційний файл для моделі машинного навчання системи Bot Management. Ця зміна в поведінці запиту призвела до появи великої кількості дублікатів даних, що, у свою чергу, викликало швидке зростання конфігураційного файлу, який перевищив ліміти пам’яті. Через це вийшла з ладу основна проксі-система, яка обробляє трафік клієнтів, що використовують модуль ботів.
Як наслідок, клієнти, які застосовували згенерований показник ботів у своїх правилах, почали блокувати реальний трафік, що призвело до серйозних проблем на платформах, що залежали від цієї технології. Тим часом компанії, які не використовували цю функцію, залишалися без проблем онлайн.
Cloudflare уточнила, що проблема не мала нічого спільного з DNS, атаками чи новими технологіями на базі генеративного штучного інтелекту. Помилка виникла саме у внутрішній логіці оновлення конфігураційних файлів у системі Bot Management.
Для запобігання подібним інцидентам у майбутньому компанія оголосила чотири основні кроки для посилення безпеки та стабільності:
- Посилення обробки конфігураційних файлів та користувацького введення
- Розширення кількості глобальних “kill switch” для функцій
- Запобігання ситуаціям, коли core dump або звіти про помилки можуть перевантажувати систему
- Перегляд усіх режимів відмови у ключових проксі-модулях
Cloudflare також зазначила, що її мережа обробляє близько 20% всього інтернет-трафіку, тому будь-яка помилка в основних модулях може мати глобальні наслідки.
Товар дня EVA 19 листопада: що можна купити зі знижкою -50% лише сьогодні.
