Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Syncsort et Vertica pulvérisent le record mondial de l'ETL (extraction, transformation, chargement) des bases de données avec HP BladeSystem c-Class


Rédigé par Communiqué de Syncsort le 2 Décembre 2008

La plate-forme HP BladeSystem c-Class réduit les coûts et supprime les obstacles à la performance en permettant d'extraire, de transformer et de charger 5,4 téraoctets de données en moins d'une heure



Syncsort (http://www.syncsort.com/), l'un des principaux fournisseurs mondiaux de solutions logicielles d'intégration et de protection des données et de tri à grande vitesse, et Vertica, société innovante sur le marché des systèmes de gestion des bases de données analytiques haute performance, en collaboration avec HP, ont établi un nouveau record du monde du chargement de données dans une base de données relationnelle pour les applications de veille stratégique optimisées par HP BladeSystem c-Class. Ce nouveau record mondial répond aux attentes de plus en plus pressantes en termes de vitesse de chargement, permettant aux entreprises d'intégrer rapidement des données à partir de plusieurs sources. Alors que la taille des bases de données ne cesse de grandir, ce résultat permet aux entreprises d'accélérer leur RCI et d'optimiser leurs temps et prise de décision.

Ce nouveau record du monde pulvérise les précédentes performances enregistrées en termes d'extraction, de transformation et de chargement (ETL). L'outil d'intégration de données de Syncsort DMExpress(TM) (http://www.syncsort.com/products/dmx/home.htm) v4.8 a permis d'extraire, de transformer, de nettoyer et de charger 5,4 téraoctets de données brutes dans la base de données analytique Vertica en 57 minutes et 21,51 secondes via HP BladeSystem c-Class, une plate-forme hautement rentable utilisant le système d'exploitation Linux RedHat. Les données ont été générées via l'outil de génération de données du test de performance TPC-H correspondant à la norme industrielle.(*)

<< Nos clients, issus de secteurs tels que la finance, les assurances, les télécommunications, les biens de consommation courante, la vente au détail, l'industrie pharmaceutique et le e-commerce, nous disent avoir besoin de traiter et de charger rapidement des volumes de données à la croissance exponentielle de manière à prendre des décisions vitales >>, explique Harvey Tessler, vice-président directeur du marketing chez Syncsort. << Notre solution est conçue pour répondre à ces attentes tout en maîtrisant les coûts. >>

La solution Syncsort/Vertica a été exécutée sur deux boîtiers HP BladeSystem c7000 utilisant une combinaison de serveurs lame et de lames de stockage. L'efficacité du logiciel, couplée à la modularité et à la maniabilité de la plate-forme HP BladeSystem c-Class, a permis d'atteindre des niveaux de contrôle, de flexibilité adaptative et de performance sans précédent. La densité et la flexibilité de la plate-forme HP BladeSystem a permis à tout le cluster en shared nothing de 16 noeuds, y compris toute la mémoire de disque, de tenir dans moins d'un demi rack (20U) avec un excellent rendement énergétique.

Le record établi par Syncsort et Vertica sur HP BladeSystem c-Class en matière d'ETL est par ailleurs le premier à être réalisé avec une base de données en colonnes. << Jusqu'à présent, les bases de données présentées en colonnes étaient considérées comme moins performantes en termes de vitesse de chargement par rapport aux bases de données traditionnelles, présentées en lignes >>, explique David Menninger, vice-président du marketing & de la gestion des produits de Vertica. << La technologie des bases de données de nouvelle génération a révolutionné ce paradigme en accélérant de manière radicale l'exécution des requêtes dans des téraoctets de données traités, sans pour autant faire du débit de chargement des données le maillon faible de la chaîne. Nous avons conçu la base de données analytique Vertica et mis en place un partenariat avec Syncsort dans le but d'offrir les performances les plus rapides qui soient tout au long du cycle de déploiement. >>

<< Les organisations recherchent des solutions rentables leur permettant d'optimiser leur prise de décision, ce qui a été démontré par la combinaison des technologies de Syncsort, Vertica et HP >>, déclare Steve Gillaspy, responsable de groupe pour BladeSystem chez HP. << La combinaison de ces technologies de base de données analytique et d'intégration de données, ainsi que les caractéristiques intéressantes de la plate-forme HP BladeSystem c-Class - prix abordable, hautes performances et norme industrielle -, permettent de proposer un produit attractif pour de nombreuses analyses de gestion. >>

En combinaison avec la base de données analytique Vertica, les entreprises peuvent donner à leurs spécialistes un accès plus rapide à de plus gros volumes de données de manière à surpasser leurs concurrents sur le plan de la conception comme de l'exécution.

La base de données Vertica a répondu à des requêtes de téraoctets de données de 50 à 200 fois plus vite que les technologies de base de données concurrentes en utilisant moins d'espace disque et de matériel pour une part infime du coût représenté par les autres produits.

Détails du test de performance

Les performances et l'extensibilité de DMExpress v4.8 et de Vertica v2.5 ont été testées au moyen de 16 serveurs lame HP ProLiant BL460c à deux processeurs quatre coeurs et 16 lames de stockage HP StorageWorks SB40c. L'outil de génération de données (DBGEN) du test de performance TPC-H répondant à la norme industrielle a été utilisé pour générer les données source représentant des données de gestion contenant divers types de données.

Les résultats du test de performance ont fait l'objet d'un audit indépendant et ont été vérifiés par George Spofford, de DSS Labs.

Pour plus d'informations sur la solution Syncsort-Vertica ou pour télécharger le document technique sur le livre blanc portant sur ce nouveau record et rédigé par DSS Labs, consulter le site http://www.ETLWorldRecord.com.

Claudia Imhoff d'Intelligent Solutions (http://www.intelsols.com/), spécialiste notée de l'entreposage de données et de la veille économique, tiendra un webcast expliquant les implications de ce nouveau test de performance le mardi 16 décembre 2008, à 14h00 (HNE). Pour plus de détails, consulter le site de la société au http://www.vertica.com.




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.