05 Ekim 2021

Facebook ne yaşadı?

Kısacası Türkiye’deki operatörler için son zamanlarda çok duymaya başladığım “eleman azlığı” ya da “nitelikli eleman azlığı” sorunu olmuş. Ya da en azından nitelikliler uzaktan çalışırken, sunucuların yanındaki elemanlar yeterince nitelikli değillermiş. Bunu birileri “ucuzcu” diye de yorumlamış ama sizlerin de bildiği gibi sosyal medyada her türlü yorum olur.

Facebook sıkıntısının  yaşanma düzeyini gösterir grafik (Türkiye'de Internet Trafik Değişim Noktası olmadığı için kırmızı değiliz)

4 Ekim’de TSİ 18:44'te başlayan Facebook grubu kesintisi sadece kullanıcıları değil, kendi çalışanlarını da etkilemiş. Mailleşemedikleri, iletişim kuramadıkları ve hatta kimlik kartları çalışmadığı için binaya kilitlenmiş oldukları raporlanıyor.

Facebook ve alt platformlarının 4 Ekim 2021 Pazartesi günü yaşadığı 5 saatlik sıkıntıyı, Cloudflare şirketi analiz ederek blogunda ve Twitter üzerinden yayınladı[1]. Kısaca şöyle özetlenebilir;

  • "Facebook'un DNS adları çözümlenmesi durdu ve altyapı IP'lerine erişilemedi."

İnternet IP denilen numaralarla haberleşir. Hem siteler, hem de internet açık herşeyin adresi bir IP numarasıdır. Yani bir siteyi açmak için onun IP numarasını kullanırsınız. Facebook IP'si 31.13.79.35. Ama size bu numarayı hatırlayın, sonra da filanca gazete için başka 4 bloklu numarayı aklınızda tutun denemeyeceği için bunlar bir sunucuda (root server) isimlendirilir. Yani 31.13.79.35=Facebook.com gibi. İşte sorun bu. Facebook ile 31.13.79.35 eşleştirilememiş. Bunun nedeni uzun detaylı ama olay kısaca bu[2].

İnternet şebekesi çok büyük olduğu için, bellekleme yapılır. Yani siz Facebook dediğinizde her seferinde root sunucuya gitmezsiniz. Yakınınızdaki cihazın ön belleğinde en çok kullandıklarınız bulunur. Bu hız ve trafiğin kolaylaştırılması için gereklidir. İnternet böyle çalışır. Tersine, bu durum bir bozuldu mu, sıkıntı büyür. Zaten Cloudflare yöneticileri de bunu anlatıyor;

  • "Facebook DNS sunucuları çevrimdışı oldu. Tüm dünyadaki DNS çözümleyicileri alan adlarını çözümlemeyi bıraktı. Bunun nedeni, İnternet'teki diğer birçok sistem gibi DNS'nin de kendi yönlendirme mekanizmasına sahip olmasıdır. Birisi tarayıcıya https://facebook.com URL'sini yazdığında, alan adlarını bağlanılacak gerçek IP adreslerine çevirmekten sorumlu DNS çözümleyici, önce önbelleğinde bir şey olup olmadığını kontrol eder ve kullanır. Değilse, genellikle kendisine sahip olan varlık tarafından barındırılan alan ad sunucularından yanıtı almaya çalışır. Ad sunucularına erişilemiyorsa veya başka bir nedenle yanıt veremezse, bir SERVFAIL döndürülür ve tarayıcı kullanıcıya bir hata verir."

Bu arada Cloudflare kendilerinde bir hata olup olmadığını kontrol etmiş.

Şimdi gelelim "bu sorun nasıl oluştu" konusuna?

Burada garip yorumlar var. Gibson Araştırmadan Steve Gibson diyor ki; Rutin Facebook BGP güncellemesinde sorun çıkmış. Olayı uzaktan erişen birileri düzeltmeye kalkmış. Sunucuya fiziksel erişimi olanların ise yetkisi yokmuş”.

Cloudflare da benzer bir şey söylüyor ve  salgın nedeniyle veri merkezlerindeki personel sayısının azalmasından kaynaklanabileceğine değiniyor. CloudFlare Reddit'te yayınlanan ama sonra silindiği kaydedilen bir yoruma da değiniyor.

  • "FB hizmetlerinin DNS'i etkilendi. Bu muhtemelen asıl sorunun bir belirtisi. Büyük olasılıkla kesintiler meydana gelmeden kısa bir süre önce yürürlüğe giren bir yapılandırma değişikliği nedeniyle, 15:40 UTC'de başlayan olayda, Facebook eşleme yönlendiricileriyle BGP eşlemesi çöktü. …”

Kısacası Türkiye’deki operatörler için son zamanlarda çok duymaya başladığım “eleman azlığı” ya da “nitelikli eleman azlığı” sorunu olmuş. Ya da en azından nitelikliler uzaktan çalışırken, sunucuların yanındaki elemanlar yeterince nitelikli değillermiş. Bunu birileri “ucuzcu” diye de yorumlamış ama sizlerin de bildiği gibi sosyal medyada her türlü yorum olur. Doğruları olduğu gibi, sırf kızdığı için birileri gereksiz yorumlar yapabilir. 

Yarın ve birkaç gün internet trafiği zorlanacak

TSİ ile 00:20'de geri dönen Facebook ve alt sitelerinin yarın bütün bu milyonlarca cihaza tekrar hatırlatılması (ya da yeniden tanımlanması) ve belleğe alınması işlemi olacağından internet bir hayli yoğun olacak. Steve Gibson bunun 30 kat olacağını belirtiyor;

Son olarak da Cloudflare yorumunu kaydedelim;

  • "5 milyar kullanıcının çalışmasını sağlamak için İnternetteki milyonlarca sistem ve protokolünün, standardizasyon, işbirliği ve güven sayesinde çalışıyor."

Bunu unutmayalım ve internetin altyapısını kuran ve devamlılığı sağlayanlara şükran duygularımızı iletelim. Facebook, Instagram ya da WhatsApp sevenler, bugün bile bunun olmadığında ne yaşadığınızın bir örneğini hissettiniz mi?


[1] Understanding How Facebook Disappeared from the Internet

[2] https://turk-internet.com/bidenin-siber-farkindalik-ayi-baslarken-amerikan-platformlarina-ne-oluyor/

Yazarın Diğer Yazıları

Ülkemizin internet hızı, mobilde dünya 71’incisi ve sabitte dünya 113’üncüsü

Bakan Bey acaba biraz detay verebilir mi, 113. sıradaki internet ile gençlerimize nasıl bir gelecek düşünüyor ya da düşünüyorlar

Prof. Dr. Murat Güvenç: AKP'nin oy kaybı yaşadığı bölgeler, genç nüfusun olduğu yerler

"Emekli tezi ülke düzeyinde bir ölçüde geçerli olabilir, ancak en azından İstanbul'da çok geçerli değil"

5G’de Türkiye’nin adı hala yok

Ülkede güya 4.5G olarak adlandırılan LTE Advance var ama aslında yok gibi...