Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Talend Episode 2 : le plan de développement produits après l’introduction en bourse et la nomination d’un nouveau PDG


Rédigé par le 17 Janvier 2017

A l’occasion de la conférence Talend Connect, qui a eu lieu à Paris, nous avons rencontré Laurent Bride, CTO de l’éditeur. Beaucoup de changements chez Talend, détaillés lors de cette première conférence utilisateurs depuis l’introduction en Bourse de l’été dernier. Et un plan de développement complet que nous détaille Laurent Bride.



Laurent Bride, CTO de Talend
Laurent Bride, CTO de Talend
En 2017, les deux fondateurs de Talend, Bertrand Diard et Fabrice Bonan ont disparu de l’organigramme opérationnel de l’entreprise. Avec son introduction sur le Nasdaq, l’éditeur est devenu américain, et le management s’est internationalisé. Une partie importante des équipes de développement est en France et pour longtemps, ce qui explique sans doute en partie la nomination en 2014 d’un français, Laurent Bride ancien de chez BusinessObjects, à la tête de la recherche et développement.

A l’occasion de sa conférence utilisateurs qui réunissait à Paris l’équipe de management, des clients et des partenaires, Laurent Bride, CTO de Talend, a fait le point sur le plan de développement de l’éditeur à moyen terme, l’évolution de l’architecture de la plateforme et des outils qui seront proposés dans les prochains mois.

Decideo : Premier sujet, la qualité des données. Un sujet vaste, où l’on parle de qualité, mais aussi de gouvernance, de gestion des données de références, de processus d’alimentation… vous regroupez l’ensemble sous le terme de « data integrity ». Quels sont les développements en cours, et envisagés ?

Laurent Bride : Nous avions déjà un ensemble d’outils destinés aux « data stewards ». Leur métier est de récupérer des données en provenance de plusieurs sources (des bases de données, des applications métiers), et de créer les données maîtres, compilation de l’ensemble, cohérentes, et qui serviront de référence aux utilisateurs dans l’entreprise. Talend fournit déjà des outils pour les y aider. Mais ces outils avaient besoin d’une refonte complète de leur interface utilisateurs. C’est fait.
Bien sûr l’objectif est également d’automatiser au maximum ces tâches; pour cela nous utilisons des techniques de machine learning.

L’architecture de la plateforme a évolué. Nous développons maintenant des micro-services, qui sont ensuite appelés et utilisés depuis plusieurs produits de notre gamme. C’est graduel, et transparent pour l’utilisateur. Ainsi, ces micro-services vont être utilisés dans la plateforme de Data Quality, dans Data Preparation, dans Data Stewardship. Nous sommes en train de repackager l’ensemble.
On pourrait imaginer demain, que ces micro-services puissent être appelés directement par les clients, dans leurs propres développements, sans forcément passer par l’interface utilisateurs Talend, à travers des API. C’est le cas de notre offre MDM (Master Data Management). Dans sa version 6.2 qui est sortie l’été dernier, nous avons fourni une couche complète d’API. Cela n’a pas d’impact sur l’offre commerciale, le client utilise ce qu’il souhaite, mais on pourrait plus tard imaginer que ces micro-services soient facturés au volume. Nous proposons d’ailleurs déjà en OEM ces services, avec certains éditeurs comme General Electric ou Sidetrade.

Pour l’instant nous avons encore deux codes différents, suivant que l’on est en cloud ou installé sur le serveur de l’entreprise. La prochaine génération de plateforme de Talend (en 2018) nous permettra d’unifier l’ensemble. C’est un processus déjà en cours, en particulier avec la version 6.2. La solution globale de gouvernance permet d’inclure des données, et des méta-données, stockées dans des applications en cloud et sur les serveurs de l’entreprise.
Notre architecture sera hybride, afin de respecter également les souhaits de certains clients (dans la finance par exemple), dont certaines données ne pourront jamais être stockées en cloud.
Nous travaillons également sur le portage de notre solution sur plusieurs services d’infonuagique : aujourd’hui Amazon, demain Google, Microsoft Azure.

Decideo : Autre thématique sur laquelle tous les clients investissent, le Big Data. Qu’est-ce que cela signifie pour Talend en termes d’évolutions ?

Laurent Bride : Notre prochaine version prévue pour ce mois de janvier, mettra à jour notre compatibilité avec un certain nombre de distributions.
Talend Data Preparation fonctionne actuellement avec un serveur, développé en Java, et qui tourne sur une machine virtuelle Java, pas dans un cluster Hadoop. Lorsque l’on atteint des volumes importants de transformations, cela devient difficile. La nouvelle solution Talend Data Préparation proposera un serveur d’exécution sous Spark, donc sur un cluster Hadoop. Ca reste développé en Java, mais génère du code Spark natif. L’évolutivité sera bien meilleure pour les traitements de gros volumes de données.
Autre point important, l’évolution de la connectivité. De plus en plus de services sont hébergés en cloud, et les analystes ont besoin d’y accéder, pour consommer ces données. Ces lacs de données utilisent des formats parfois propres au monde du big data. Data Preparation pourra par exemple se connecter à son cluster Hadoop pour accéder directement aux données, plutôt que de les récupérer localement. Nous pouvons déjà le faire, mais en passant par Talend Studio, et en créant manuellement les processus. Ce n’était pas à la portée d’un utilisateur métier. Ce sera bientôt en self-service.

Decideo : La problématique de la préparation des données, et du temps que cela occupe, est évidente. C’est un goulot d’étranglement pour les éditeurs de solutions de BI en self-service. D’ailleurs Tableau vient d’annoncer la sortie d’un outil de préparation des données, donc un concurrent de Talend ? Qu’en pensez vous ?

Laurent Bride : Je suis dans l’édition de logiciels depuis 20 ans, un jour on est partenaire, un jour on est concurrent. Tableau sera peut-être capable de se connecter à une source de données, mais ils ne seront pas capables de faire de l’intégration de données à la volée. Tableau n’est pas un outil d’intégration. Ce n’est pas leur coeur de métier. C’est en revanche notre métier.
Tableau n’est pas le seul d’ailleurs, Informatica, SAP Business Objects, ont également des fonctions de préparation de données. Tableau est un peu challengé ces derniers temps, en terme de croissance, de plan de développement.

Decideo : Tableau, comme maintenant Talend, doit également répondre aux attentes des analystes financiers, depuis la cotation en bourse. Et c’est très difficile de répondre à ces attentes de croissance, avec un seul produit. Comment allez-vous faire ?

Laurent Bride : Nous ferons comme tout le monde. Nous devrons descendre ou monter… Est-ce que l’on commencera à rentrer dans l’analytique ? On verra. Nous avons encore beaucoup de temps devant nous. Le prochain relais de croissance pour nous, c’est la gouvernance : comprendre les modèles de données, les inclure dans une approche collaborative. Nous n’avons pas de problème de croissance.

Mon enjeu, comme CTO, c’est de servir tous les clients, et de livrer les produits. Et de recruter suffisamment pour combler tous les besoins. Notre croissance est à deux chiffres également sur les recrutements. Il y a environ 200 personnes chez Talend en R&D, mais avec un portefeuille de produits assez étendu. Notre développement est essentiellement en France, avec un centre à Nantes, qui emploie 20 personnes (100 personnes fin 2018); Suresnes environ 60 personnes, 20 personnes à Bonn, et le reste en Chine, environ 80 personnes. La Chine n’est plus cependant un axe de croissance de notre R&D. L’axe de croissance, c’est notre équipe de Nantes. La différence de coût n’est plus significative avec la Chine. Elle était de 1 pour 4 il y a dix ans. Elle est aujourd’hui de 1 pour 1,5.
Je suis très content de notre équipe de Nantes. Et pour eux, c’est intéressant d’intégrer un éditeur de logiciels. L’essentiel des emplois dans la région est plutôt dans des sociétés de services, de l’outsourcing de banques ou de compagnies d’assurances.

Decideo : Vous avez choisi la couche d’abstraction BEAM. De quoi s’agit-il ?

Laurent Bride : Aujourd’hui lorsque l’on créé des processus d’intégration dans Talend Studio, on les crée graphiquement. Puis nous générons du code Java standard. D’un clic droit, le même processus peut être transformé en code MapReduce, ou en Spark. Pour notre équipe de développement, cela signifie que chaque action, un tri, un agrégat, un remplacement, doit être codé dans chacun de ces langages. Et nous devons supporter de plus en plus d’environnements. Mais le coût d’adaptation à chaque environnement est important. Nous ne pouvons donc pas tout développer. Nous avons cherché une couche d’abstraction, où nous pourrions écrire tous nos programmes, et qui disposerait de composants d’exécution pour les faire fonctionner dans un maximum d’environnements.
Avec BEAM]urlblank:https://beam.apache.org/ (géré par Apache), le code est donc en BEAM Java, puis il est compilé en fonction de l’environnement d’exécution où l’on souhaite déployer la solution développée.
La valeur ajoutée de Talend est plus en amont, dans la création de l’ensemble des processus d’intégration, que dans le déploiement sur plusieurs environnements. Ce que j’ai toujours vu dans l’informatique, ce sont des étapes. Nous sommes arrivés avec l’innovation de la génération de code à partir d’une interface graphique. Cela nous a permis de passer de l’ombre à la lumière, d’afficher des taux de croissance de 100%. Demain ce sera autre chose. L’innovation d’hier deviendra une commodité. Il faut continuer à innover et à créer de la valeur ailleurs.
Les plates-formes de gestion de données sont devenues des commodités : Hadoop, Spark… et les autres, sont en open source, et gratuits. La valeur ajoutée est dans les applications, dans la gouvernance. Le cloud lui-même est une commodité.

Decideo : qu’en est-il des données non structurées, dont on parle beaucoup en Big Data, mais qui semblent absentes des projets concrets ?

Laurent Bride : Lorsqu’il y aura assez business à faire, bien sûr, nous y serons. Aujourd’hui nous donnons déjà du sens à des données structurées, mais aux structures extrêmement complexes. Nous n’allons pas écrire un moteur de traitement du langage par exemple. Mais nous intégrer avec un outil existant, qui extraira de la valeur des méta-données. Un jour nous nous intégrerons peut-être avec du blockchain. Mais nous en sommes plus au niveau de la recherche. Lorsque les clients nous le demanderons, nous saurons répondre à leurs demandes. Mais ce n’est pas pour nous dans les 12 à 18 mois. Il y a une demande, mais c’est un sujet compliqué.
Si l’on prend l’exemple des algorithmes de reconnaissance d’images de Google TensorFlow. Ce n’est pas tant l’algorithme qui pose un problème, mais les besoins de la plateforme qui le mettrait en production à un niveau industriel : les machines, la puissance de calcul, et il faudra packager l’ensemble. Talend peut être la solution d’intégration, mais toutes ces analyses seront apportées par des services extérieurs, à travers des API REST. Notre solution est complément extensible et ouverte pour consommer ce type de services. C’est le client qui, en fonction de ses besoins, va intégrer tout cela dans notre plateforme.




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.