Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Talend passe son ETL open source en V2


Rédigé par le 23 Avril 2007

Decideo a été le premier site à faire découvrir l’ETL Talend aux internautes. Ce qui nous a d’ailleurs souvent été reproché, par les éditeurs traditionnels qui ne comprenaient pas que l’on ouvre nos colonnes à un projet open source encore inconnu, et ensuite par tous ceux qui souhaitaient le tester mais ont du attendre plusieurs mois la disponibilité d’une version définitive. Dix-huit mois après les premières annonces, Talend passe aujourd’hui en version 2 ; l’occasion pour nous de revenir sur les premiers résultats obtenus.



Talend passe son ETL open source en V2
Lors de la pré-annonce de ce projet, nous avions osé présenter Talend comme le « premier ETL français en open source ». Talend nous l’avait reproché, considérant que le qualificatif de « français » était réducteur dans un monde de l’open source sans frontières. Indéniablement en quelques mois, Talend a été poussé par ses levées de fonds et se joue aujourd’hui des frontières. L’éditeur est présent en France avec son département « Recherche », en Chine avec son département « Développement » et aux Etats-Unis pour y lancer ses opérations commerciales. Pour Bertrand Diard, fondateur de Talend, le choix de la Chine est rationnel : « Nous avons installé en Chine une équipe de développement de quinze personnes ; le rapport de coût varie de 1 à 5 entre la Chine et la France ». Mais le département « Recherche » reste en France car s’ils sont qualifiés d’excellents exécutants, les développeurs chinois semblent encore manquer de créativité et d’imagination. Aux Etats-Unis c’est une équipe de cinq personnes qui a été installée à Palo Alto dans la Silicon Valley depuis le début de cette année. Une installation indispensable pour suivre son marché car 45 % des téléchargements de Talend viennent d’outre-Atlantique.

Bertrand Diard a su également s'entourer de professionnels reconnus de l'intégration de données et du décisionnel. On retrouve ainsi au conseil d'administration Gilles André, créateur de l'ETL Genio revendu à Hummingbird. Hubert Catanese, PDG de Reportive, conseille l'entreprise; et les équipes opérationnelles ont été renforcées récemment avec l'arrivée de Yves de Montcheuil (ex-Sunopsis), Vincent Pineau (ex-Microstrategy) ou encore François Méro.

Souvent critiqué : le manque de transparence des éditeurs de projets open source qui mettent en avant le nombre de téléchargements, laissant croire qu’il représente le nombre de leurs clients. Talend souhaite communiquer sur ce point en toute transparence et annonce 60 000 téléchargements de son ETL. Mais Bertrand Diard précise immédiatement que sur ces téléchargements annoncés, environ 20 % laissent leur email et leur pays d’origine. Mais surtout environ 50 % des internautes ayant téléchargé le logiciel ont installé le composant automatisant les mises à jour qui permet ainsi de mesurer leur utilisation du produit. Le chiffre de 30 000 utilisateurs de Talend ne semble donc pas irréaliste, même si parmi eux figurent nombre de consultants, étudiants, concurrents… Basant son modèle de développement sur les prestations de service, Talend a déjà signé des contrats avec plusieurs sociétés : Accor, Endesa, Semidep, Etai…

La version 2 du logiciel génère maintenant du code Java alors que la précédente se contentait du Perl. Une évolution importante qui répond à la demande des utilisateurs, mais qui contredit quelque peu les choix initiaux de Talend qui semblait fortement lier son destin au langage Perl. En s’intégrant maintenant à des projets Java, Talend en profite pour mettre en avant sa capacité de traitement. Bertrand Diard cite ainsi un test comparatif qu’ils auraient réalisé contre Ascential : Talend traiterait un million de lignes en 6 secondes contre 20 secondes pour Ascential.
Autre évolution majeure, l’architecture ELT (suivant le modèle médiatisé par Sunopsis) qui consiste à faire réaliser les traitements de transformation directement dans la base de données de destination. Des versions de Talend pour Oracle et MySQL vont être rapidement disponibles puis développées pour Microsoft SQL Server, Ingres, Netezza, Teradata…
La version 2 propose également une centaine de nouveaux composants fonctionnels (qualité des données, dédoublonnage, comparaison de fichiers, accès à des webservices…) dont certains visent à permettre à Talend d’évoluer du domaine de l’ETL décisionnel à l’intégration de l’ensemble des données du système d’information ; un positionnement identique à celui de son concurrent Informatica. Des accords ont d’ailleurs déjà été signés avec SugarCRM, Salesforce.com et des composants d’intégration sont en cours de développement pour Siebel (Oracle), SAP, Sage, LDAP, OpenBravo…




Commentaires

1.Posté par Sophie Salinas le 23/04/2007 11:16
Il semblerait que Talend ai le vent en poupe, car plusieurs de mes clients avouent reflechir autour de cette outil en le mettant a l'epreuve au travers de POC. Certains ont meme fait le choix face a DataStage qui est la source d'inspiration, au moins dans l'interface.
La societe SQLI le presente dans son architecture Open Source au travers d'un petit dejeuner (voir le site de la societe www.sqli.com).
Personnelement, je l'ai telecharger 4 à 5 fois, et je pense que malgre toutes les regles que l'on peut inventer, Talend reste un produit jeune et pas aussi implanté que cela, avec un avenir tres tres prometteur.
Sophie


2.Posté par Philippe Nieuwbourg le 23/04/2007 12:12
Intéressant la remarque de Sophie qui nous dit "je l'ai téléchargé 4 à 5 fois"... Même si je ne vois pas forcément l'intérêt, cela pourrait être un indicateur de division de l'estimation du nombre d'utilisateurs.
Qu'en pensez vous ? Combien de fois téléchargez-vous un logiciel open source avant de vous faire une opinion ?

3.Posté par JPhilippe François le 23/04/2007 14:16
Bonjour,
j'ai également fait plusieurs "download" de l'ETL Talend, simplement pour l'installer sur différents postes de travail, ou pour le faire connaitre à d'autres personnes de mon entourage... ou plus simplement parce que la possibilité de le télécharger me permet également de ne pas le stocker...
Cette solution est plutôt intéressante et bien conçue, même si j'ai un peu de mal à croire que cette solution puisse du jour au lendemain être un concurrent frontal de solutions plus abouties. Avez-vous connaissance de sociétés "type grand compte" qui utilisent en production cette ETL ou plus exactement ELT, Talend "ne fait que" générer du code exécutable en PERL ou JAVA. Les versions annoncées pour différentes bases de données ne seront elles pas un handicap pour l'éditeur, au regard de la multiplicité des versions à maintenir et à faire évoluer... Par ailleurs quel est le véritable ROI, sachant que le gain effectif ne peut se faire que sur le coup des licences... les coûts indirects restant les mêmes qu'avec une solution commerciale traditionnelle : formation, prestation, support et les charges de développement de projet. Les éditeurs "Open Source" finissent tous par proposer une évolution de leurs offres vers des versions "payantes" proposant des modules additionnels permettant un fonctionnement en condition opérationnelle dans un contexte d'entreprise. A terme la solution est-elle finalement moins coûteuse qu'un solution "classique" ? le R.O.I. de l'Open Source est ailleurs ! comme la ... vérité !

4.Posté par Stefan le 25/04/2007 00:58
Pour avoir testé Talend , c'est pas mal .Toujours 4-5 téléchargements pour ma part , et une version collaborative serait la bienvenue.

Sinon , pour répondre à JPhilippe François , d'autres éditeurs utilisent cette techno de générateur de code. Même une version d'Ascential Datastage il me semble ou des acteurs très pointus de type Abinitio etc. Coté architecture , la solution generateur de code permet de basculer rapidement entre ETL et ELT ce qui est un avantage notable en souplesse mais pose des questions techniques et d'administration/maintenance. Coté performance , le générateur de code est souvent supérieur aux autres technos.

Sinon , pour les projets open source vous perdez entre 20 à 50% de temps en plus en MOE , mais 0 licence. Le ROI est souvent supérieur , mais les DSI se "cachent" souvent derrière une image de marque pour avoir un parapluie en cas de problème. Un autre "problème" est que la plupart des customisations se font avec un effort supérieur et la maintenance est plus coûteuse en main d'oeuvre mais gratuite coté contrat ( par rapport à 20% chez BO par exemple ).

Seule conclusion : l'open source PEUT constituer une alternative , surtout si vous avez un centre de compétence Java en interne.

5.Posté par JPhilippe Francois le 25/04/2007 06:11
Bonjour,
Effectivement d'autres solutions de type ETL ou ELT utilisent le principe de la génération de code. Cela présente notamment l'intérêt de pouvior désynchronyser la plateforme de développement et la plateforme d'exploitation dans la mesure où cette dernière ne peut héberger que le "script exécutable" final. L'un des avantages également de la solution Talend, réside dans son approche permettant au travers d'une même interface de proposer une visoin fonctionnelle via le "Business Model", une vision technique via le "Job Designer" et la gestion des "métadonnées". Pour votre info le Groupe SQLI organise prohainement le 4 mai prochain un petit déjeuner sur le thème "l'Open Source en architecture décsionnelle" où seront present les éditeurs "Talend" pour la partie intégration "Mysql" pour la base de données et Actuate pour le reporting avec "Birt V2.1"... une bonne occasion pour se faire un idée plus précise ! voir sur le site de SQLI.