L’opération massive de cloud computing d’Amazon a subi sa troisième panne en un mois mercredi dernier, fermant brièvement un grand nombre de services en ligne essentiels à la vie quotidienne et mettant à nouveau en évidence les vulnérabilités d’un Web de plus en plus interconnecté.
Amazon Web Services a signalé sur sa page d’état qu’une panne de courant dans un centre de données en Virginie du Nord a déclenché des problèmes de connectivité à partir de 7h30 du matin, perturbant un large éventail de géants en ligne, des salles de discussion professionnelles de Slack au magasin de jeux d’Epic. Jeux. La connectivité réseau est revenue à la normale vers 10 heures du matin, a indiqué la société.
Il s’agit de la dernière de plusieurs pannes AWS récentes qui ont détruit une grande partie de l’économie numérique. Il y a trois semaines, des problèmes de service liés à des périphériques réseau défectueux ont mis hors ligne les sonnettes Ring et les aspirateurs Roomba d’Amazon. Une autre panne s’est produite il y a deux semaines.
Les systèmes cloud tels qu’AWS permettent aux entreprises de louer des serveurs et de la puissance de calcul sur le Web, et ils ont révolutionné Internet avec la promesse d’une dorsale en ligne fiable, disponible à tout moment.
Mais les pannes ont souligné à quel point cette consolidation des capacités autrefois distribuées d’Internet signifie également qu’une seule défaillance peut entraîner des effets d’entraînement étendus, affaiblissant l’épine dorsale cachée sous-jacente à une grande partie du Web.
« Un seul problème chez un fournisseur de premier plan aura d’énormes implications sur d’innombrables organisations de toutes tailles, de manière souvent très inattendue », a déclaré Ed Skoudis, président du SANS Technology Institute. « Les interruptions de service sont vastes et ont un impact sur des milliers d’entreprises et des millions d’utilisateurs. Nous mettons plus d’œufs dans de moins en moins de paniers. Plus d’œufs sont cassés de cette façon. »
Amazon n’a pas immédiatement répondu aux demandes de commentaires. Le fondateur d’Amazon, Jeff Bezos, est propriétaire du Washington Post.
Il est difficile de maintenir en ligne de manière fiable un “cloud” géant de centres de données internationaux, a déclaré Steven Bellovin, professeur d’informatique à l’Université de Columbia. Chaque modification doit être testée avant d’être déployée et étroitement surveillée par la suite, avec un moyen automatique de revenir en arrière en cas de problème et un filet de sécurité de logiciels redondants et de serveurs de sauvegarde, juste au cas où.
Amazon n’a pas publié de détails techniques sur les défauts sous-jacents et des pannes occasionnelles sont attendues. Mais tant d’erreurs en peu de temps suggèrent que certains des systèmes de sauvegarde pourraient être inadéquats pour la tâche, a déclaré Bellovin.
“La réponse courte est que je suis dérangé”, a-t-il ajouté. “Je suis depuis longtemps un fan des services cloud … et il est possible que ce ne soit qu’une coïncidence maligne pour Amazon … mais s’ils ne peuvent pas s’adapter à la croissance, ils sont mal placés.”
AWS est le plus grand fournisseur mondial de services de cloud computing, avec 40 % du marché mondial l’année dernière pour les services cloud d’infrastructure, selon le cabinet d’études de marché Gartner. Microsoft était loin derrière, avec environ 20 pour cent.
Mais se déplacer parmi les plus grands services de cloud computing – AWS d’Amazon, Azure de Microsoft et Google Cloud – est un défi, car chaque système fonctionne différemment et s’appuie sur sa propre infrastructure.
De plus en plus d’entreprises, a déclaré Skoudis, commencent à parler d’utiliser plusieurs systèmes cloud simultanément, même si l’approche est coûteuse et “un peu ridicule, étant donné que le cloud a été présenté comme nous offrant fiabilité et prix abordable”.
Les causes des trois pannes de ce mois révèlent comment la complexité et les exigences croissantes du cloud ont conduit à un plus grand potentiel de catastrophe. La panne de cinq heures du 7 décembre, ont écrit les ingénieurs d’AWS dans un post-mortem, a été causée par un problème dans certains logiciels automatisés qui a conduit à un « comportement inattendu » qui a ensuite « submergé » les périphériques réseau AWS et touché les systèmes informatiques de la côte est.
La deuxième panne, qui a duré moins d’une heure le 15 décembre, a affecté principalement les appareils de la côte ouest et a été imputée à une « congestion du réseau » en raison d’une ingénierie interne qui « a déplacé à tort plus de trafic que prévu vers des parties de la dorsale AWS qui ont affecté la connectivité. “, selon un communiqué de l’entreprise.
Lors de la panne de mercredi, qui, selon Amazon, était due à des problèmes d’alimentation du centre de données, les utilisateurs de Downdetector, un site de mesure des pannes Internet, ont déclaré avoir eu des difficultés à accéder à des sites tels que le service de streaming vidéo Hulu et le site d’investissement Fidelity.
L’année dernière, d’énormes pans du Web ont été mis hors ligne après que les serveurs d’Amazon en Virginie du Nord ont été débordés. Et Skoudis soupçonne que d’autres problèmes surgiront à mesure qu’Internet se complexifiera.
“Dans le domaine informatique, nous plaisantons parfois sur la façon dont nous passons 15 ans à centraliser l’informatique, suivis de 15 ans à décentraliser, suivis de 15 autres années à centraliser à nouveau”, a-t-il déclaré. “Eh bien, nous avons passé les 10 dernières années à centraliser à nouveau, cette fois sur (le) cloud.”
.
L’opération massive de cloud computing d’Amazon a subi sa troisième panne en un mois mercredi dernier, fermant brièvement un grand nombre de services en ligne essentiels à la vie quotidienne et mettant à nouveau en évidence les vulnérabilités d’un Web de plus en plus interconnecté.
Amazon Web Services a signalé sur sa page d’état qu’une panne de courant dans un centre de données en Virginie du Nord a déclenché des problèmes de connectivité à partir de 7h30 du matin, perturbant un large éventail de géants en ligne, des salles de discussion professionnelles de Slack au magasin de jeux d’Epic. Jeux. La connectivité réseau est revenue à la normale vers 10 heures du matin, a indiqué la société.
Il s’agit de la dernière de plusieurs pannes AWS récentes qui ont détruit une grande partie de l’économie numérique. Il y a trois semaines, des problèmes de service liés à des périphériques réseau défectueux ont mis hors ligne les sonnettes Ring et les aspirateurs Roomba d’Amazon. Une autre panne s’est produite il y a deux semaines.
Les systèmes cloud tels qu’AWS permettent aux entreprises de louer des serveurs et de la puissance de calcul sur le Web, et ils ont révolutionné Internet avec la promesse d’une dorsale en ligne fiable, disponible à tout moment.
Mais les pannes ont souligné à quel point cette consolidation des capacités autrefois distribuées d’Internet signifie également qu’une seule défaillance peut entraîner des effets d’entraînement étendus, affaiblissant l’épine dorsale cachée sous-jacente à une grande partie du Web.
« Un seul problème chez un fournisseur de premier plan aura d’énormes implications sur d’innombrables organisations de toutes tailles, de manière souvent très inattendue », a déclaré Ed Skoudis, président du SANS Technology Institute. « Les interruptions de service sont vastes et ont un impact sur des milliers d’entreprises et des millions d’utilisateurs. Nous mettons plus d’œufs dans de moins en moins de paniers. Plus d’œufs sont cassés de cette façon. »
Amazon n’a pas immédiatement répondu aux demandes de commentaires. Le fondateur d’Amazon, Jeff Bezos, est propriétaire du Washington Post.
Il est difficile de maintenir en ligne de manière fiable un “cloud” géant de centres de données internationaux, a déclaré Steven Bellovin, professeur d’informatique à l’Université de Columbia. Chaque modification doit être testée avant d’être déployée et étroitement surveillée par la suite, avec un moyen automatique de revenir en arrière en cas de problème et un filet de sécurité de logiciels redondants et de serveurs de sauvegarde, juste au cas où.
Amazon n’a pas publié de détails techniques sur les défauts sous-jacents et des pannes occasionnelles sont attendues. Mais tant d’erreurs en peu de temps suggèrent que certains des systèmes de sauvegarde pourraient être inadéquats pour la tâche, a déclaré Bellovin.
“La réponse courte est que je suis dérangé”, a-t-il ajouté. “Je suis depuis longtemps un fan des services cloud … et il est possible que ce ne soit qu’une coïncidence maligne pour Amazon … mais s’ils ne peuvent pas s’adapter à la croissance, ils sont mal placés.”
AWS est le plus grand fournisseur mondial de services de cloud computing, avec 40 % du marché mondial l’année dernière pour les services cloud d’infrastructure, selon le cabinet d’études de marché Gartner. Microsoft était loin derrière, avec environ 20 pour cent.
Mais se déplacer parmi les plus grands services de cloud computing – AWS d’Amazon, Azure de Microsoft et Google Cloud – est un défi, car chaque système fonctionne différemment et s’appuie sur sa propre infrastructure.
De plus en plus d’entreprises, a déclaré Skoudis, commencent à parler d’utiliser plusieurs systèmes cloud simultanément, même si l’approche est coûteuse et “un peu ridicule, étant donné que le cloud a été présenté comme nous offrant fiabilité et prix abordable”.
Les causes des trois pannes de ce mois révèlent comment la complexité et les exigences croissantes du cloud ont conduit à un plus grand potentiel de catastrophe. La panne de cinq heures du 7 décembre, ont écrit les ingénieurs d’AWS dans un post-mortem, a été causée par un problème dans certains logiciels automatisés qui a conduit à un « comportement inattendu » qui a ensuite « submergé » les périphériques réseau AWS et touché les systèmes informatiques de la côte est.
La deuxième panne, qui a duré moins d’une heure le 15 décembre, a affecté principalement les appareils de la côte ouest et a été imputée à une « congestion du réseau » en raison d’une ingénierie interne qui « a déplacé à tort plus de trafic que prévu vers des parties de la dorsale AWS qui ont affecté la connectivité. “, selon un communiqué de l’entreprise.
Lors de la panne de mercredi, qui, selon Amazon, était due à des problèmes d’alimentation du centre de données, les utilisateurs de Downdetector, un site de mesure des pannes Internet, ont déclaré avoir eu des difficultés à accéder à des sites tels que le service de streaming vidéo Hulu et le site d’investissement Fidelity.
L’année dernière, d’énormes pans du Web ont été mis hors ligne après que les serveurs d’Amazon en Virginie du Nord ont été débordés. Et Skoudis soupçonne que d’autres problèmes surgiront à mesure qu’Internet se complexifiera.
“Dans le domaine informatique, nous plaisantons parfois sur la façon dont nous passons 15 ans à centraliser l’informatique, suivis de 15 ans à décentraliser, suivis de 15 autres années à centraliser à nouveau”, a-t-il déclaré. “Eh bien, nous avons passé les 10 dernières années à centraliser à nouveau, cette fois sur (le) cloud.”
. — to www.theday.com