Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


BENCHMARK ETL - SSIS 2008 / Talend 3


Rédigé par Communiqué de Startners le 8 Avril 2009

Analyse comparative des performances :
Microsoft SQL Server Integration Services 2008 et TALEND Open Studio 3.0.2



Dossier complet de 32 pages, téléchargeable gratuitement.

Cette étude se focalise sur les temps de traitement nécessaires aux réalisations d’opérations basiques de transfert de données, et ceci avec les deux ETL dans diverses combinaisons de sources et cibles, de nombres de colonnes plus ou moins importants et de volumétries multiples.

Le but de ce document n’est pas de démontrer que le développement et la mise en oeuvre de flux de données sont plus aisés avec tel ou tel ETL mais bien de montrer les capacités en termes de performance de chaque outil dans un contexte technique courant.

Le dossier décrit les architectures, les choix techniques et les tests.
Les résulats sont présentés sous forme de tableaux et de graphiques.
Des observations puis des conclusions sont faites.

Dossier pdf téléchargeable sur http://www.stratners.com
Bonne lecture et n'hésitez à nous faire part de vos remarques !




Commentaires

1.Posté par Fabrice le 14/04/2009 19:13
Hmmm...

les résultats de ce "bench" sont à prendre au deuxième degré... ils utilisent le loader SSIS (Fast Load) et le mode ligne à ligne dans Talend (Insert basique), pas étonnant qu'il y ait des différence...
La moindre des choses pour un bench est d'utiliser la même méthode pour tous les outils !!!!!!


2.Posté par Pierre le 16/04/2009 17:22
Sans être un expert, j'ai l'impression que ce comparatif tente de comparer de produits très différents :
SSIS : Windows Only, Intel only, fermé...
TAlend : Multi OS, multi architecture, ouvert...

De plus les composants utilisés ne suivent pas la même approche. Je suis sur que je peux obtenir des temps 1000 fois plus lent en utilisant une approche différente pour comparer 2 produits... ça ne veut pas dire grand chose... dommage...
p.

3.Posté par Xavier le 27/04/2009 23:00
J'ai lu avec attention cette étude, ayant travaillé avec des 2 ETL dans des contextes variés.

A la remarque sur les plateformes, on pourrait dire la même chose de Java et de .Net, ça n'avance à rien, c'est un troll d'informaticien de plus.

Pour ce qui est du fast load de SSIS, même si c'est orienté chargement en masse, tout se fait en mémoire et en flux continu depuis la source vers la cible, source qui peut être n'importe quoi, une table, un fichier, le résultat d'une transformation.
De mémoire Talend ne propose qu'un dump dans un fichier et insert en masse via loader, rien à voir avec le buffer de SSIS.

Pour moi, dans l'optique de lire la donnée et de l'insérer dans la base cible sans passer par un outil externe, ils ont fait au mieux avec les 2 solutions.

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.