Google donne plus de détails sur l'incident de mise en réseau de ses services cloud

**Jonathan** · 04/06/2019, 22h56

Google : voici ce qui a causé la grande panne de dimanche
d'après le vice-président de l'ingénierie chez Google

Dimanche dernier, il est survenu dans certaines régions des Etats-Unis, une perturbation du réseau de Google, qui a entraîné des erreurs et des ralentissements de plusieurs de ses services. Pour la plupart des utilisateurs, cela n'a pas vraiment été perceptible, il est possible qu'ils aient pu constater que les requêtes de recherche étaient un tout petit peu plus lente que d'habitude, mais cela n'a probablement pas duré plus de quelques minutes. Par contre, pour ceux des utilisateurs qui dépendent de services hébergés dans les régions touchées par la panne, l'impact a été bien plus considérable.

Dans un article de blog, Benjamin Treynor Sloss, vice-président de l'ingénierie chez Google, s'est excusé auprès de toutes les personnes ayant été affectées par cette panne et a également fait savoir que la principale cause de la perturbation était un changement de configuration, destiné à un petit nombre de serveurs dans une même région. En temps normal, tout aurait dû se passer sans aucun problème, mais la configuration a été appliquée de manière incorrecte à un plus grand nombre de serveurs dans plusieurs régions voisines, ce qui a obligé ces régions à utiliser plus de la moitié de leur capacité réseau disponible.

La capacité restante du réseau étant insuffisante pour contenir le trafic réseau en provenance et à destination de ces régions, les systèmes de réseau de Google ont donc dû effectuer un tri sur le surplus de trafic en donnant la priorité aux flux de données plus sensibles au temps de latence. L'impact a été sévère pour les plateformes à bande passante élevée telles que YouTube, mais moins pour les services à bande passante réduite tels que Google Search, qui n'a connu qu'une brève augmentation du temps de latence. Le problème en lui-même a été détecté par les équipes d'ingénierie de Google en quelques secondes, mais sa résolution a pris beaucoup plus de temps.

Pendant toute la durée de la panne, plusieurs des services de Google ont été gravement impactés. C'est le cas de YouTube qui, globalement a enregistré une baisse de 2,5 % du nombre de vues en une heure, Google Cloud Storage n'a pas non plus été épargné et a enregistré une réduction de 30 % de son trafic. Pendant que plusieurs trouvent ces explications légères et s'attendent à en avoir des plus détaillées sur les causes profondes de cette panne, Sloss fait savoir que les équipes d'ingénierie de Google continuent de travailler afin de comprendre tous les facteurs qui auraient contribué à la perte de capacité du réseau et à la lenteur de la restauration. Les conclusions de ce travail seront probablement communiquées d'ici peu.

Source : Google

Et vous ?

Qu'en pensez-vous ?

Vous êtes-vous rendus compte de cette pertubation du réseau de Google ?

Pensez-vous qu'il s'agisse simplement d'un problème lié à une configuration incorrecte de serveurs ?

Voir aussi :

Google Drive rencontre un problème majeur de spam la firme rassure et annonce la résolution du problème dans un futur proche

Mozilla revient sur la panne qui a affecté les modules complémentaires de son navigateur Firefox et donne des détails techniques

Google provoque accidentellement une panne massive d'Internet au Japon qui a duré des heures bien que l'erreur ait été corrigée après 8 minutes