Cloudflare อธิบาย เกิดอะไรขึ้นกับเครือข่ายอินเทอร์เน็ตบ้างหลัง Facebook ล่ม

ปัญหาเครือข่าย Facebook ล่มเมื่อคืนนี้ ยังไม่มีการอธิบายสาเหตุอย่างละเอียด โดย Mike Schroepfer ซีทีโอ Facebook โพสต์ผ่านทวิตเตอร์ บอกแค่คร่าวๆ ว่าเป็นปัญหาเครือข่าย (networking issues)

ระหว่างที่เรารอคำชี้แจงอย่างละเอียดจาก Facebook ว่าเกิดอะไรขึ้น บริษัทผู้เชี่ยวชาญด้านเครือข่าย Cloudflare ก็ออกมาอธิบายในมุมของคนนอก ว่าเครือข่ายอินเทอร์เน็ตเกิดอะไรขึ้นบ้างเมื่อ Facebook ตัดตัวเองไปจากอินเทอร์เน็ต

คนที่มีความรู้เรื่องการทำงานของ Border Gateway Protocol (BGP) และ autonomous systems (AS) คงเข้าใจเรื่องนี้อยู่แล้ว แต่สำหรับคนที่ไม่เคยได้ยินสองคำนี้มาก่อน ก็เป็นโอกาสดีในการเรียนรู้โครงสร้างการทำงานของเครือข่ายอินเทอร์เน็ต

Cloudflare บอกว่าจากระบบมอนิเตอร์ของตัวเอง พบว่า Facebook หยุดประกาศเส้นทางในระบบ DNS เมื่อเวลา 16:58 UTC (23:58 น. ตามเวลาประเทศไทย) ส่งผลให้ระบบ DNS 1.1.1.1 ของ Cloudflare ไม่สามารถตอบคำถามได้ว่าโดเมน facebook.com เป็นหมายเลขไอพีใด

ตอนแรก Cloudflare ตกใจคิดว่าเป็นปัญหาที่ระบบเครือข่ายของตัวเอง แต่จากการสอบสวนพบว่าประมาณหนึ่งชั่วโมงก่อนหน้านั้น (15:40 UTC หรือ 22:40 น. ของบ้านเรา) พบการเปลี่ยนสถานะเส้นทางใน BGP ของ Facebook ซึ่งเป็นจุดเริ่มต้นของปัญหารอบนี้

สิ่งที่เกิดขึ้นคือ เส้นทางไปยัง Facebook ถูกถอนออกจากตารางข้อมูลเส้นทาง, เซิร์ฟเวอร์ DNS ของ Facebook ออฟไลน์ (ตอนนี้เรายังไม่รู้สาเหตุจากข้างในว่าเกิดจากอะไร)

เมื่อ Facebook หยุดประกาศเส้นทางในระบบ BGP ทำให้ไม่มีใครในอินเทอร์เน็ตรู้ว่าจะส่งข้อมูลไปเซิร์ฟเวอร์ของ Facebook ได้อย่างไร ส่งที่เกิดขึ้นคือทุกคนวิ่งมาถามเซิร์ฟเวอร์ DNS ซ้ำอีกรอบ (หรือหลายๆ รอบ) ว่า Facebook อยู่ที่ไหน ทำให้เซิร์ฟเวอร์ 1.1.1.1 ของ Cloudflare ได้รับทราฟฟิกเพิ่มขึ้นถึง 30 เท่าทันที

และ Cloudflare ถือโอกาสว่าระบบของตัวเองเจ๋งมาก รองรับโหลดได้สบาย แม้ระยะเวลา response time เพิ่มขึ้นมาก แต่ก็ยังต่ำกว่า 10ms (เส้นสีฟ้า) ยกเว้นบางกรณีที่อาจนานถึง 10 วินาที (เส้นสีส้ม)

การล่มของ Facebook ยังทำให้ทราฟฟิกไปยังบริการโซเชียลอื่นๆ พุ่งขึ้นด้วยเช่นกัน เช่น Twitter, Signal, Telegram, Tiktok

พอถึงเวลา 21:17 UTC (4:17 น. ของบ้านเรา) ทราฟฟิก BGP ของ Facebook เริ่มกลับมา ระบบ DNS เริ่มกลับสู่ปกติ และใช้งานได้ราว 21:20 UTC

ที่มา - Cloudflare



from Blognone https://www.blognone.com/node/125101
via IFTTT