1 To pour 10 $ par mois : Archivage et sauvegarde chez Amazon... mais pas pour de l'analyse


Rédigé par le 23 Aout 2012



Amazon a récemment annoncé un nouveau service de stockage : Amazon Glacier.
Le nom choisi est parfaitement évocateur des objectifs de ce service : geler des données pour une longue période.
La présentation faite par Amazon est parfaitement claire : "Amazon Glacier est un service de stockage à très faible coût qui fournit des capacités de stockage sécurisées et durables pour l'archivage et la sauvegarde des données. Afin de maintenir les coûts au niveau le plus bas, Amazon Glacier est optimisé pour les données auxquelles vous accédez de manière occasionnelle et pour lesquelles un délai d'extraction de plusieurs heures reste acceptable". Amazon Glacier n'est pas un service de stockage de données en ligne, destinées à être lues, analysées, comparées… C'est un service destiné à "oublier" des données.

Nos collègues de LeMagIT pointent du doigt les coûts élevés de transfert sortant des données à partir de ce service. Ils ont raison, mais il ne s'agit en aucun cas de coûts cachés. Amazon est très clair sur les objectifs et donc le modèle économique de ce service. Il est à comparer avec les services de stockage sur bandes dont sont encore équipés les grands systèmes. Amazon Glacier est dédié aux sauvegardes, mais il présente un rapport capacité/prix de stockage très intéressant pour ce type de service.

A partir de 0,01$ par mois pour 1 Go de données, le coût de conservation d'une archive de 1 téraoctet de données se chiffre à 120 $ par an ! Imbattable ! Bien sur, le jour où vous en avez besoin, vous devrez mettre la main au carnet de chèques pour payer les frais de rapatriement de ces données. Amazon Glacier fonctionne donc un peu comme une assurance : un coût faible, qui couvre un risque important, mais dont vous espérez ne jamais avoir besoin.

Il est donc en conclusion totalement déconseillé pour la mise en place d'un projet Big Data, dont le principe même est l'analyse des données. Et si votre projet Big Data consiste juste à sauvegarder des téraoctets sans les analyser, changer de projet ou appelez-le "sauvegarde". Vous serez plus cohérent.



Dans la même rubrique :