Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


IBM choisit Trifacta pour développer une solution de « Data Preparation »


Rédigé par le 12 Août 2019

IBM dispose d’une solution ETL complète, DataStage, rachetée en 2005, mais pas d’une solution de préparation des données, plus orientée bureautique. IBM a choisi de travailler avec Trifacta afin de développer une intégration entre les solutions des deux éditeurs.



Photo m0851 / Unsplash
Photo m0851 / Unsplash
Après avoir travaillé plusieurs mois en collaboration, IBM et Trifacta ont révélé fin juin leur partenariat. Il semble que IBM ait confié à Trifacta le développement d’un outil de préparation des données, connecté à l’écosystème IBM. La « data preparation », dont Trifacta revendique la paternité, est un nouveau marché. Les « ETL » sont des outils techniques, destinés aux équipes informatiques, et à l’industrialisation des projets. Les outils de préparation de données sont plus orientés utilisateurs, plus agiles, mais aussi moins rigoureux. Ils prennent une place entre Excel et les ETL.

Comme le souligne très bien Trifacta, la différence entre deux projets de science des données n’est pas vraiment dans les algorithmes. La plupart sont disponibles en open source et ouverts à tous. Mais plutôt dans les données qui alimenteront ces algorithmes. Et ces données doivent être nettoyées, préparées, et référencées.
Les utilisateurs avancés ont pris l’habitude d’utiliser ces nouveaux outils de préparation. Mais ils ne sont pas sans défauts ! Plutôt que de supprimer les silos de données, ils ont plutôt tendance à en recréer de nouveaux. Chaque jeu de données, nettoyé et préparé, est sauvegardé par son utilisateur, qui créé ainsi un nouveau silo, bien souvent non référencé et non partagé…

Trifacta propose de nommer, étiqueter, et partager ces jeux de données dérivés. Et dans le cadre du partenariat avec IBM, l’idée est de combiner ces nouveaux jeux de données avec l’outil de gouvernance IBM Watson Data Catalog.

Que deviendra ce partenariat par la suite ? Impossible à deviner. Mais si IBM y voit une opportunité d’affaires intéressante, il n’hésitera pas à racheter Trifacta afin de s’assurer la maitrise et le futur de cette solution de préparation des données.






Commentaires

1.Posté par Patrick De Freine le 24/09/2019 14:01
Excellent billet dont la concision n'a d'égale que sa précision chirurgicale : positionnement des outils de data prep, mythe du décisionnel sans silos, lien avec la data gouv. Total respect.

Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store