Une startup avait détecté la panne du Cloud d'Amazon 2 heures avant

le 29/10/2012, par Jean Pierre Blettner avec IDG News Services, Cloud / Virtualisation, 502 mots

A l'heure où de plus en plus d'applications migrent vers le cloud, comment faire en cas de panne ? Des sociétés proposent des solutions afin de suivre les performances et de basculer sur des systèmes de secours. Nous en sommes aux premiers pas.

Une startup avait détecté la panne du Cloud d'Amazon 2 heures avant

La startup Boundary annonce qu'elle avait détecté une activité anormale chez ses clients deux heures avant qu'Amazon n'officialise une panne sur son offre Cloud, le lundi 22 octobre. 

Des sites web tels que Reddit, Imgur ou Heroku s'étaient arrêtés. La société Boundary développe un logiciel qui permet de détecter rapidement une panne dans un Cloud. Elle indique que la récente panne du Cloud d'Amazon (AWS) lui a permis de prouver que le système fonctionne à grande échelle.

La solution de Boundary est un outil d'APM (application performance management) qui installe un agent dans le cloud afin de mesurer chaque seconde les performances des machines virtuelles qui fonctionnent dans un Cloud public. Boundary centralise ces informations pour ses centaines de clients.

Le lundi 22 octobre, presque deux avant qu'Amazon n'officialise un problème sur son service de stockage Elastic Block Storage (EBS), qui est un service de stockage utilisé en conjonction avec l'hébergement de machines virtuelles, Elastic Cloud Compute (EC2), Boundary avait relevé une activité anormale dans le Cloud AWS.

Durant les deux heures qui suivirent, presque le tiers des agents de Boundary, parmi ses 300 clients, avaient cessé de renvoyer des informations. Les transferts de données depuis le Cloud AWS vers les serveurs de Boundary avaient décru de 27%, passant de 38 Mbit/s à 28 Mbit/s.

Illustration source Citrix. 



La latence afin de communiquer avec les agents de Boundary situés dans le Cloud d'Amazon avait été multipliée par trois. Même lorsqu'AWS avait indiqué que le problème était quasiment résolu, la latence restait au même niveau élevé. « Il n'y a pas de moyen d'être à l'intérieur de l'infrastructure d'Amazon » indique Boundary, « C'est pourquoi nous essayons d'être un indicateur, et d'alerter nos clients. »

L'intérêt d'être alerté le plus tôt possible est de pouvoir par exemple basculer applications depuis une zone de disponibilité (Availability zone) vers une autre, ou vers un autre fournisseur de Cloud, voire dans leur propre data centre. Ces actions sont difficile à anticiper toutefois, car l'industrie en est à ses débuts.

Boundary n'est pas la seule société à fournir ce type d'analyse pour le Cloud. On trouve des outils d'APM pour les machines virtuelles chez NetScout, Riverbed,, Network Instruments, IBM, HP ou CA Technologies.  En ce qui concerne la technologie de Boundary, chaque VM est suivie individuellement même lorsqu'elle change de Cloud. Chaque client reçoit des historiques de 10 mn sur les performances mesurées chaque seconde. L'objectif est d'offrir une vision sur les dernières 24 heures, ainsi qu'un relevé mensuel, minute par minute.

Bien que AWS n'ait pas expliqué en détail de ce qui a réellement causé la panne du dernier weekend, celle-ci est le troisième incident majeur en 2 ans. En ce qui concerne la panne de juillet 2012, Amazon avait déclaré que des pannes d'électricité, des bugs et des goulets d'étranglement avaient créé les soucis.

Intel adopte le SDN dans ses fonderies

Afin de bénéficier d'une connectivité machine sans temps d'arrêt, le géant américain de puces a mis en place un réseau défini par logiciel (Software Defined Network, SDN) dans ses usines de fabrication de...

le 04/09/2023, par Paula Rooney, IDG NS (adapté par Jean Elyan), 1361 mots

Rachat de VMware, Broadcom tente de rassurer les clients et les...

Avec ces investissements supplémentaires, Broadcom entend rassurer les clients et les instances de régulation tout en aidant les entreprises à déployer des clouds privés et à développer l'écosystème VMware....

le 09/05/2023, par Michael Cooney, IDG NS (adapté par Jean Elyan), 740 mots

Stax étend ses services cloud à l'international avec AWS

Grâce à un contrat de collaboration avec AWS, l'entreprise australienne, spécialiste du cloud, prévoit de s'étendre en Amérique du Nord, en Asie du Sud-Est et en Europe. L'accord de collaboration pluriannuel,...

le 05/04/2023, par Sasha Karen, ARN (adaptation Jean Elyan), 568 mots

Dernier dossier

Les white-box sont-elles l'avenir de la commutation réseau ?

Et si vous pouviez gérer vos commutateurs de centres de données et vos routeurs de la même façon que vos serveurs et ainsi réduire les coûts des dépenses en capital ? C'est la promesse des white-box qui amènent des systèmes d'exploitation réseau open source fonctionnant sur du matériel courant.Pour en avoir le coeur net, nous avons testé Cumulus...

Dernier entretien

Céline Polo

DRH du groupe iliad

"Nous recrutons dans des métiers en tension, en particulier sur l'infrastructure réseau, pour lesquels il y a...