După ce mai serioasă cădere a serviciilor sale din ultimul deceniu, Facebook a explicat într-un articol cauza întreruperii serviciilor din rețeaua proprie și a aplicațiilor WhatsApp, Instagram și Messenger.
Astfel, compania susține că unele modificări realizate la ruterele din centrele de date au făcut practic cele patru servicii ”invizibile” pentru restul utilizatorilor de internet.
”Schimbările realizate la configurarea ruterelor care coordonează rețelele de trafic dintre centrele de date ale companiei au dus la întreruperea comunicării cu rețeaua de internet. Această întrerupere a traficului în rețele a avut un efect în cascadă asupra comunicării dintre centrele noastre de date, oprind serviciile noastre”, a scris Facebook.
Compania condusă de Mark Zuckerberg și-a cerut scuze față de utilizatorii afectați, cu trimitere la milioanele de afaceri și antreprenori care utilizează cele patru rețele pentru a-și promova serviciile și produsele.
John Graham-Cumming, expert în cadrul companiei de securitate Cloudflare, a explicat pe Twitter că problema ține, cel mai probabil, de serverele Facebook, care nu le permit utilizatorilor să se conecteze la site-uri ca Instagram sau WhatsApp. Calculatoarele convertesc site-uri precum facebook.com în protocoale interne numerice, printr-un sistem care este asemănător cu agenda telefoanelor. Cumming mai spune că problema Facebook este ca și cum ai înlătura numerele de telefon ale unor persoane din agenda de telefon, ceea ce face ca ei să nu mai poată fi aplelați. Cloudfare furnizează unele soluții pentru infrastructura de net a Facebook.
Cauza tehnică a problemelor este o eroare DNS (sistem de nume de domeniu, abreviat DNS, în engleză Domain Name System) – ceea ce înseamnă că site-urile și aplicațiile nu pot fi văzute pe ”harta” internetului. Ce a cauzat această eroare DNS însă? Cloudfare e explicat că problema inițială a fost provocată de o eroare a BGP (Border Gateway Protocol) – un mecanism care conectează literalmente rețelele din care este formată marea rețea numită internet.
- Citește mai jos postarea integrală a Facebook:
To all the people and businesses around the world who depend on us, we are sorry for the inconvenience caused by today’s outage across our platforms. We’ve been working as hard as we can to restore access, and our systems are now back up and running. The underlying cause of this outage also impacted many of the internal tools and systems we use in our day-to-day operations, complicating our attempts to quickly diagnose and resolve the problem.
Our engineering teams have learned that configuration changes on the backbone routers that coordinate network traffic between our data centers caused issues that interrupted this communication. This disruption to network traffic had a cascading effect on the way our data centers communicate, bringing our services to a halt.
Our services are now back online and we’re actively working to fully return them to regular operations. We want to make clear at this time we believe the root cause of this outage was a faulty configuration change. We also have no evidence that user data was compromised as a result of this downtime.
People and businesses around the world rely on us everyday to stay connected. We understand the impact outages like these have on people’s lives, and our responsibility to keep people informed about disruptions to our services. We apologize to all those affected, and we’re working to understand more about what happened today so we can continue to make our infrastructure more resilient.