Jeudi dernier, le 21/4, pendant plus de 24h, les services d'Amazon sur le Cloud situé dans le Datacenter de Virginie du Nord étaient downs. Cela a entraîné l'interruption de centaines de milliers de sites et de nombreuses startups ayant pignon sur rue. Plus important que l'incident lui même, qu'il faudra analyser mais qui semble venir de la partie EBS, le stockage en mode block, de l'infrastructure, c'est le fait que le Cloud ne va pas magiquement faire disparaître tous les problèmes qui étaient légions dans l'infogérance classique :

- On aura toujours besoin d'électricité pour alimenter le bazar - Ca dégagera toujours des tonnes de joules qu'il faudra dissiper avec de la clim de plus en plus performante - Le réseau sera toujours le goulot d'étranglement, surtout qu'aujourd'hui on y fait aussi passer le stockage des données. - Les développeurs continueront à nous pondre des bugs (et le Cloud, c'est surtout des APIs donc du développement qui fait des opérations très périeuses). - Les humains se prendront toujours les pieds dans les fils (et débrancheront le datacenter) - Les sauvegardes marcheront toujours. Par contre les restaurations... - et il y en a des dizaines d'autres...

Bref, un bonne stratégie d'utilisation du Cloud doit inclure une gestion des risques et un plan en cas de sinistre. Le DRP ou PRA en français n'est pas mort, au contraire dans le Cloud il a encore plus de sens, et est même économiquement abordable !

Si l'incident est de la responsabilité d'Amazon, le fait que les sites soient tombés est de la responsabilité de leur propriétaire et de leur développeur. Dans le Cloud, c'est le développement qui doit être bulletproof, pas l'infrastructure.