Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


TALEND LANCE UNE SOLUTION OPEN SOURCE DE QUALITE DE DONNEES


Rédigé par Communiqué de Talend le 20 Août 2008

Talend Data Quality est la première suite Open Source combinant des fonctions d’intégration de données, de Data Profiling et de qualité de données



Talend, premier éditeur de logiciels d’intégration de données Open Source, annonce aujourd’hui le lancement de Talend Data Quality, première suite Open Source combinant des fonctions d’intégration de données, de Data Profiling et de qualité de données.

Talend Data Quality identifie des données erronées ou inexactes telles que des doublons, des surnoms et des adresses postales incomplètes, puis les corrige en utilisant des données de référence issues de différents fournisseurs, comme par exemple les bases de références postales de différents pays. La solution permet même aux entreprises de distinguer des surnoms peu évidents à discerner, tels que « Peggy », « Peg », « Marge » et « Meg », diminutifs de « Margaret ». Dans le passé, des données incomplètes de ce type auraient contribué à des envois multiples ou peu efficaces, qui contrarient les clients, diminuent la qualité des fichiers commerciaux et réduisent la productivité des collaborateurs.

« Dans les systèmes d’information interconnectés d’aujourd’hui, les données de mauvaise qualité se répandent de la même manière que les virus » déclare Bertrand Diard, CEO et co-fondateur de Talend. « Les entreprises, quel que soit leur secteur d’activité, sont conscientes du coût induit par la mauvaise qualité des données : ventes ratées, perte de productivité, envois coûteux non nécessaires et détérioration de l’image de l’entreprise. Talend Data Quality "nettoie" ces données erronées jusqu’à ce qu’elles soient justes, complètes et cohérentes, afin que les entreprises puissent récupérer le contrôle de l’une de leurs plus précieuses ressources : leurs données. ».

Talend Data Quality permet aux entreprises de confirmer des adresses, des numéros de téléphone, et l’orthographe de noms et d’abréviations, en les comparant avec des millions d’autres enregistrements, dont ceux de La Poste en France et des bases de données issues de nombreux pays. La solution est par exemple capable de déterminer que « François-Xavier Durand, 15 boulevard Berthelot » et « FX Durand, 15 bvd Bertelot » sont la même personne, ce qui permet d’éviter d’envoyer plusieurs documents à la même adresse.

« Des données incorrectes engendrent des décisions incorrectes. C’est pourquoi des données de bonne qualité sont essentielles à la réussite de toute entreprise » déclare Mark Madsen, Président de Third Nature, société spécialisée dans la recherche technologique. « Une gestion efficace de la qualité des données est encore plus critique dans le cadre de l’interopérabilité applicative. L’Open Source réduisant considérablement les barrières à l’entrée, de nombreuses entreprises seront en mesure de bénéficier de ses avantages. »

Parmi les principales fonctionnalités de Talend Data Quality figurent :

► Data Profiling : fournit une visibilité instantanée et un historique de la qualité des données de votre entreprise, afin de vous aider à mesurer l’amélioration ou la dégradation de la qualité de vos données dans le temps.

► Identification des données erronées : identifie individuellement les données de bonne et de mauvaise qualité.

► Nettoyage des données : corrige les données incorrectes, incomplètes ou incohérentes, en procédant à des vérifications croisées avec d’autres bases de données et données de référence.

► Enrichissement des données : enrichit les données à l’aide d’informations diverses – latitude et longitude, données INSEE, notation de crédit ou autre information permettant de valoriser ces données – par exemple en permettant de cibler des mailings en fonction de catégories socio-professionnelles ou en organisant les tournées de livraison par proximité géographique.

L’annonce du lancement de Talend Data Quality intervient deux mois après le lancement de Taled Open Profiler, premier Data Profiler Open Source, et met en relief le rôle pionnier de Talend en matière d’intégration et de qualité de données.

Talend Data Quality sera disponible à partir de septembre 2008 sous la forme d’une solution autonome ou d'un add-on pour Talend Integration Suite.




Commentaires

1.Posté par François le 21/08/2008 09:33
On ne peut que saluer l'initiative mais attention aux effets d'annonce. Cela fonctionne sans doute bien pour des données US/UK, mais pour des données françaises (adresses, noms de famille ...) je demande à voir.

Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store