Talend passe son ETL open source en V2


Rédigé par le 23 Avril 2007

Decideo a été le premier site à faire découvrir l’ETL Talend aux internautes. Ce qui nous a d’ailleurs souvent été reproché, par les éditeurs traditionnels qui ne comprenaient pas que l’on ouvre nos colonnes à un projet open source encore inconnu, et ensuite par tous ceux qui souhaitaient le tester mais ont du attendre plusieurs mois la disponibilité d’une version définitive. Dix-huit mois après les premières annonces, Talend passe aujourd’hui en version 2 ; l’occasion pour nous de revenir sur les premiers résultats obtenus.



Lors de la pré-annonce de ce projet, nous avions osé présenter Talend comme le « premier ETL français en open source ». Talend nous l’avait reproché, considérant que le qualificatif de « français » était réducteur dans un monde de l’open source sans frontières. Indéniablement en quelques mois, Talend a été poussé par ses levées de fonds et se joue aujourd’hui des frontières. L’éditeur est présent en France avec son département « Recherche », en Chine avec son département « Développement » et aux Etats-Unis pour y lancer ses opérations commerciales. Pour Bertrand Diard, fondateur de Talend, le choix de la Chine est rationnel : « Nous avons installé en Chine une équipe de développement de quinze personnes ; le rapport de coût varie de 1 à 5 entre la Chine et la France ». Mais le département « Recherche » reste en France car s’ils sont qualifiés d’excellents exécutants, les développeurs chinois semblent encore manquer de créativité et d’imagination. Aux Etats-Unis c’est une équipe de cinq personnes qui a été installée à Palo Alto dans la Silicon Valley depuis le début de cette année. Une installation indispensable pour suivre son marché car 45 % des téléchargements de Talend viennent d’outre-Atlantique.

Bertrand Diard a su également s'entourer de professionnels reconnus de l'intégration de données et du décisionnel. On retrouve ainsi au conseil d'administration Gilles André, créateur de l'ETL Genio revendu à Hummingbird. Hubert Catanese, PDG de Reportive, conseille l'entreprise; et les équipes opérationnelles ont été renforcées récemment avec l'arrivée de Yves de Montcheuil (ex-Sunopsis), Vincent Pineau (ex-Microstrategy) ou encore François Méro.

Souvent critiqué : le manque de transparence des éditeurs de projets open source qui mettent en avant le nombre de téléchargements, laissant croire qu’il représente le nombre de leurs clients. Talend souhaite communiquer sur ce point en toute transparence et annonce 60 000 téléchargements de son ETL. Mais Bertrand Diard précise immédiatement que sur ces téléchargements annoncés, environ 20 % laissent leur email et leur pays d’origine. Mais surtout environ 50 % des internautes ayant téléchargé le logiciel ont installé le composant automatisant les mises à jour qui permet ainsi de mesurer leur utilisation du produit. Le chiffre de 30 000 utilisateurs de Talend ne semble donc pas irréaliste, même si parmi eux figurent nombre de consultants, étudiants, concurrents… Basant son modèle de développement sur les prestations de service, Talend a déjà signé des contrats avec plusieurs sociétés : Accor, Endesa, Semidep, Etai…

La version 2 du logiciel génère maintenant du code Java alors que la précédente se contentait du Perl. Une évolution importante qui répond à la demande des utilisateurs, mais qui contredit quelque peu les choix initiaux de Talend qui semblait fortement lier son destin au langage Perl. En s’intégrant maintenant à des projets Java, Talend en profite pour mettre en avant sa capacité de traitement. Bertrand Diard cite ainsi un test comparatif qu’ils auraient réalisé contre Ascential : Talend traiterait un million de lignes en 6 secondes contre 20 secondes pour Ascential.
Autre évolution majeure, l’architecture ELT (suivant le modèle médiatisé par Sunopsis) qui consiste à faire réaliser les traitements de transformation directement dans la base de données de destination. Des versions de Talend pour Oracle et MySQL vont être rapidement disponibles puis développées pour Microsoft SQL Server, Ingres, Netezza, Teradata…
La version 2 propose également une centaine de nouveaux composants fonctionnels (qualité des données, dédoublonnage, comparaison de fichiers, accès à des webservices…) dont certains visent à permettre à Talend d’évoluer du domaine de l’ETL décisionnel à l’intégration de l’ensemble des données du système d’information ; un positionnement identique à celui de son concurrent Informatica. Des accords ont d’ailleurs déjà été signés avec SugarCRM, Salesforce.com et des composants d’intégration sont en cours de développement pour Siebel (Oracle), SAP, Sage, LDAP, OpenBravo…



Dans la même rubrique :