کالبدشکافی یک حادثه: مهاجرت از RabbitMQ به Kafka
Автор: Inspect
Загружено: 2025-10-30
Просмотров: 484
Описание:
تو این قسمت از «Inspect» نشستیم و یک کالبدشکافی فنی (Post-Mortem) از یکی از بزرگترین شرکتهای دلیوری غذا، یعنی DoorDash، رو با جزئیات کامل بررسی کردیم.
داستان از یک Incident خیلی جدی روی RabbitMQ شروع شد. مشکل نه تنها از لود بالا، بلکه از نقص در معماری پیامرسان در مواجهه با رشد بیزینس نشأت میگرفت. فشار شدید روی سیستم، باعث فعال شدن مکانیسمهایی مثل Flow Control شد و در نهایت، سیستم رو دچار Connection Churn و از کارافتادگی کامل کرد.
در این ویدیو، قدم به قدم مسیر فنی مهندسان DoorDash رو دنبال میکنیم که چطور با حفظ Zero Downtime، زیرساخت حیاتی خودشون رو از RabbitMQ به Apache Kafka مهاجرت دادند و در طول راه با چالشهایی مثل Head-of-Line Blocking و Rebalancing جنگیدند.
اگه دنبال درک عمیق تفاوتهای Queue-Based و Event-Based هستید، این ویدیو برای شماست! 🚀
0:00 معرفی کانال Inspect
1:27 پستمورتم چیست؟
2:21 حادثه بزرگ DoorDash
3:11 معماری اولیه (RabbitMQ/Celery)
4:59 ریشه مشکل RabbitMQ
5:20 Connection Churn چیست؟
6:16 مکانیسم Flow Control
7:07 فاجعه Harakeri/Celery
8:45 چرا اسکیل آپ شکست خورد؟
11:22 تصمیم به مهاجرت
14:24 چرا Apache Kafka انتخاب شد؟
15:15 تغییر از Queue-Based به Event-Based
18:28 تفاوتهای Push و Pull
20:29 مهاجرت بدون دانتایم (Zero Downtime)
22:09 چالشهای کافکا بعد از مهاجرت
22:25 چالش Head-of-Line Blocking
25:07 مشکل Rebalancing هنگام Deploy
27:18 جمعبندی نهایی و درسها
لینک پستمورتم اصلی DoorDash (برای مطالعه بیشتر):
https://careersatdoordash.com/blog/elimina...
🔥 اگه این مدل آنالیز سیستمهای واقعی، معماریهای پیچیده و مهندسی بکاند رو دوست دارید، سابسکرایب کنید تا اپیزودهای بعدی رو از دست ندید 🔔
#RabbitMQ #Kafka #Postmortem #SystemDesign #Scalability #HighLoad #ConnectionChurn #Microservices #DistributedSystems #BackendEngineering #DevOps #SRE #MessageBroker #TechAnalysis #SoftwareArchitecture #ReliabilityEngineering #مهندسی_نرم_افزار #کافکا #بک_اند #معماری_سیستم
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: