Voici ce qui a causé la panne massive de Facebook, Instagram et WhatsApp

 
Facebook, Instagram et WhatsApp n’étaient pas hors ligne, ils étaient introuvables pendant six heures. Mais ça revient au même…
WhatsApp
Source : Christian Wiediger via Unsplash

Ce lundi dans la soirée, c’est une panne massive qu’ont connue les différents services de Facebook. le réseau social principal, mais aussi Messenger, Instagram, WhatsApp et même les jeux Oculus sont restés inaccessibles pendant près de six heures. Un record pour une panne de réseau social qui montre surtout les difficultés techniques qu’ont rencontrées les équipes de Facebook dans la résolution de ce problème.

Après la résolution de la panne, le groupe de Mark Zuckerberg s’est fendu d’un court communiqué afin d’expliquer la panne et de présenter ses excuses à ses utilisateurs. « Nous avons travaillé aussi dur que possible pour restaurer l’accès et nos systèmes fonctionnent désormais normalement. La cause sous-jacente de cette panne a également touché de nombreux système et outils internes que nous utilisons dans nos opérations quotidiennes, compliquant nos tentatives de diagnostiquer rapidement et de résoudre le problème ».

Un changement de configuration en cause

Facebook indique ainsi que sa panne aurait eu pour origine des « changements de configuration dans les routeurs qui coordonnent le trafic entre les data centers ». Ces changements de configuration ont eu plusieurs conséquences sur les communications entre les différents serveurs du groupe américain. « Nous voulons vous assurer que nous pensons que les causes de cette panne sont un mauvais changement de configuration. Nous n’avons aucune indication que des données des utilisateurs ont été compromises pendant la panne », tient également à rassurer Facebook. Si le groupe s’est rapidement exprimé sur les causes de la panne qu’il a subie ce lundi, les indications restent cependant vagues et il faut se tourner vers Cloudflare pour mieux comprendre les implications.

Pour rappel, Cloudflare est un réseau de distribution de contenu sur Internet, chargée notamment de faire l’intermédiaire entre l’internaute et le serveur, notamment pour protéger les sites des attaques DDoS. Fort de son expertise technique, Cloudflare a publié, ce lundi, une explication détaillée de la panne dont a été victime Facebook.

Avant de continuer, deux notions sont à prendre en compte : le DNS et le BGP. Dit vulgairement, le DNS donne l’adresse IP du site Internet, son emplacement, tandis que le BGP indique le parcours pour atteindre cette destination. Le DNS, pour Domain Name System, est un service à la base d’Internet qui va permettre de transformer une URL du type « Facebook.com » ou « Frandroid.com » en adresse IP — comme 66.220.144.0 — afin de permettre à votre navigateur de savoir à quel adresse se connecter partout dans le monde. De son côté, le BGP — pour Border Gateway Protocol — va indiquer à votre navigateur le chemin à parcourir pour atteindre l’adresse visée.

Facebook était en ligne, mais introuvable

Concrètement, il semble que ce soit un changement de configuration BGP qui soit à l’origine de la panne des services Facebook. « Le BGP permet à un réseau — comme Facebook — de promouvoir sa présence auprès des autres réseaux qui forment internet. Au moment où on écrit, Facebook ne promeut plus sa présence, les fournisseurs d’accès et les autres réseaux ne peuvent plus trouver le réseau de Facebook et il est donc indisponible », indique ainsi Cloudflare. De fait, Facebook est donc resté en ligne, mais les opérateurs Internet ne savaient plus comment y accéder.

Du côté des employés de Facebook, ce changement de configuration BGP a eu d’autres conséquences qui expliquent la lenteur de la réparation de la panne. D’abord, les employés de Facebook utilisant des adresses email en @facebook.com, les messages devaient se connecter aux serveurs de Facebook pour être envoyés. Or, en l’absence de serveur, impossible de communiquer par email. Par ailleurs, les serveurs étant déconnectés du réseau Internet, impossible également de les reconfigurer à distance. Il aura fallu que des employés se rendent directement dans les data centers pour interagir en local avec les ordinateurs pour changer la configuration.

C’est finalement après avoir pu entrer dans les data centers que les employés de Facebook ont pu reconfigurer la configuration BGP et rendre à nouveau les différents services visibles par l’ensemble du réseau Internet.

Pour aller plus loin
Panne : Facebook, WhatsApp, Instagram et Messenger commencent à revenir après 6 heures