Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Attention, chutes de chiffres chez IBM Research !


Rédigé par le 27 Août 2011

Après avoir explosé le record du nombre de fichiers lus, le laboratoire IBM d'Almaden en Californie révèle maintenant avoir créé un monstre ! Un disque de 120 petaoctets !



Le centre de recherche de IBM à Almaden - Photo copyright Google 2011
Le centre de recherche de IBM à Almaden - Photo copyright Google 2011
Il y a un an et demi, IBM mettait en place un centre analytique disposant de 1 petaoctet de mémoire de stockage pour analyser à la demande les données de ses clients. Aujourd'hui c'est peu dire que les barrières explosent car IBM Research vient d'a nnoncer la construction d'un volume de stockage unique de 120 petaoctets !

Alors pour battre le record de l'article avec le plus grand nombre de "0", voici quelques éléments de comparaison :
- Vous vous souvenez de votre premier PC dont le lecteur de disquette 5"1/4 permettait de stocker 360 Ko… Et bien 120 petaoctets, c'est 120 000 000 000 000 Ko soit 333 333 333 333 disquettes d'un IBM PC 5150 qui vient de fêter ses 30 ans. Autre élément de comparaison, c'est comme si chacun des 6 000 000 000 d'habitants de la planète disposaient chacun de 20 000 Ko (20 Mo) et les mettaient en commun !
- un disque de 120 petaoctets c'est la possibilité de sauvegarder environ 34 millions de fois les 3,5 millions de caractères que contient la Bible.
… et tout cela dans une seule unité de disque, composée de 200 000 disques traditionnels connectés entre eux. Le record précédent était de l'ordre de 15 petaoctets dans une unité de disque.
A quoi tout cela peut-il servir ? Nous ne le saurons que dans quelques années, mais savions-nous en 1981 à quoi allaient servir quelques années plus tard 1 Go ?

Au-delà du chiffre impressionnant atteint par cette équipe de chercheurs, les problèmes sous-jacents ont été importants à lever. Le nombre de disques présents impose la mise en place de systèmes de sauvegarde permanents et redondants. Dès qu'un disque connait un signe de faiblesse, son contenu est automatiquement recopié sur un système neuf, sans ralentir le calculateur, puis le disque défaillant peut être remplacé manuellement. Si le taux d'erreur augmente pendant la recopie, le système accélère automatiquement l'opération pour ne pas perdre de données. Les concepteurs indiquent que la technologie développée permettrait de disposer d'un système qui ne perdrait aucune donnée pendant un million d'années… sans doute un peu présompteux alors que la disquette a été inventée il y a tout juste 40 ans…
La chaleur dégagée par 200 000 disques dans un même espace a nécessité la mise en place d'un circuit de refroidissement par eau.

Le système de gestion de fichiers utilisé permet de répartir un même fichier sur plusieurs disques et ainsi de lire et d'écrire simultanément sur chaque morceau du même fichier. Ce système GPFS a également en juillet battu un record de lecture de fichiers.

Aux meilleurs spécialistes de l'analyse de données d'imaginer les applications qui tireront profit de ces 120 petaoctets !

Pour suivre l'actualité du centre de recherches d'Almaden : http://www.almaden.ibm.com/




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.