Как крошечная ошибка привела к сбою AWS | DynamoDB us-east-1: объяснение сбоя
Автор: ByteMonk
Загружено: 2025-11-04
Просмотров: 73036
Описание:
Даже самые надежные облачные платформы выходят из строя, и этот сбой в AWS это доказал. 19–20 октября 2025 года небольшая ошибка гонки в системе управления DNS DynamoDB от AWS привела к одному из крупнейших сбоев в облачной среде за последнее время. Эта ошибка стерла IP-адреса для основной конечной точки DynamoDB в регионе us-east-1, что привело к остановке запуска EC2, выполнения Lambda, работы сетевых балансировщиков нагрузки и даже консоли управления AWS. В этом видео мы подробно разберем, что произошло, от проектирования планировщика и исполнителя DNS до того, как процесс очистки случайно удалил работающие записи. Вы увидите, как сбой распространился по всем сервисам AWS, почему тесная взаимосвязь усилила последствия и какие уроки мы можем извлечь, чтобы сделать наши собственные системы более отказоустойчивыми. От автоматических выключателей и плавной деградации до многорегиональной архитектуры и наблюдаемости — этот реальный сбой показывает, почему отказоустойчивость и изоляция имеют решающее значение для современного проектирования систем.
Спонсор: Sevalla: 💡 Sevalla предлагает *бесплатный кредит в размере 50 долларов* для тестирования: https://sevalla.com
Ресурсы:
Блог ByteMonk: https://blog.bytemonk.io/
Курс по системному проектированию: https://academy.bytemonk.io/courses
LinkedIn: / bytemonk
Github: https://github.com/bytemonk-academy
Краткое описание AWS: https://aws.amazon.com/message/101925/
Временные метки
0:30 – Что произошло 19–20 октября 2025 г.
1:00 – Затронутые сервисы: EC2, Lambda, NLB, Console
1:27 – Как DynamoDB управляет DNS (Planner и Enactors)
2:30 – Первопричина: Гонка Состояние
3:20 – Момент, когда всё сломалось
5:00 – Каскадные сбои: EC2, Lambda, IAM и многое другое
7:40 – Развертывание Sevalla
9:00 – Уроки каскадного сбоя: тесная взаимосвязь и зависимости
9:50 – Предотвращение сбоев: автоматические выключатели и плавная деградация
11:06 – Многорегиональная архитектура: почему некоторые клиенты оставались онлайн
12:02 – Уроки наблюдаемости и мониторинга
12:30 – Главные выводы для системных проектировщиков и Архитекторы
• System Design Interview Basics
• System Design Questions
https://www.youtube.com/playlist?list... IWU
• Machine Learning Basics
• Microservices
• Emerging Tech
АВС Сертификация:
AWS Certified Cloud Practitioner: • How to Pass AWS Certified Cloud Practition...
AWS Certified Solution Architect Associate: • How to Pass AWS Certified Solution Archite...
AWS Certified Solution Architect Professional: • How to Pass AWS Certified Solution Archite...
#AWS #DynamoDB #SystemDesign #CloudComputing #Resilience #DistributedSystems #bytemonk
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: