Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Talend met Talend Open Studio for Big Data à la disposition de la communauté Apache Hadoop


Rédigé par Communiqué de Talend le 29 Février 2012

Basée sur la technologie d’intégration open source de Talend, la solution d’intégration spécifiquement dédiée au Big Data sera proposée via une licence Apache Software et livrée au sein d’Hortonworks Data Platform



Talend, l’un des leaders mondiaux des solutions open source, annonce aujourd’hui Talend Open Studio for Big Data, sous licence Apache. Talend Open Studio for Big Data repose sur la solution d’intégration open source la plus répandue au monde, Talend Open Studio, et a été enrichi du support natif d’Apache Hadoop. En outre, Talend Open Studio for Big Data sera livré au sein d’Hortonworks Data Platform - la distribution Hadoop d’Hortonworks ; la solution devenant ainsi un composant majeur d’intégration de cette plate-forme massivement évolutive et 100% open source, dédiée au stockage, au traitement et à l’analyse d’importants volumes de données.

Talend Open Studio for Big Data est une solution open source d’intégration de données puissante et polyvalente, qui améliore spectaculairement la conception de jobs d’intégration via un environnement de développement graphique particulièrement convivial. Talend Open Studio for Big Data offre un support natif de HDFS (Hadoop Distributed File System), Pig, HBase, Sqoop et Hive. En capitalisant sur l’architecture MapReduce d’Hadoop dédiée aux traitements de données hautement distribués, Talend génère en natif du code Hadoop et exécute des transformations de données directement au sein d’Hadoop, pour assurer une montée en charge maximale. Cette fonctionnalité permet aux entreprises de combiner aisément des traitements basés sur Hadoop avec des processus traditionnels d’intégration de données – qu’ils soient ETL ou ELT – pour bénéficier de performances globales supérieures.

«Talend Open Studio for Big Data devenant un composant clé d’intégration d’Hortonworks Data Platform, nous fournissons aux utilisateurs d’Hadoop la capacité de déplacer des données dans et hors d’Hadoop sans nécessité de recourir à une programmation complexe » déclare Eric Baldeschwieler, CTO et co-fondateur d’Hortonworks. « Talend offre aux entreprises la solution d’intégration open source la plus puissante du marché et nous sommes fiers de collaborer avec ses équipes pour fournir à la communauté Apache Hadoop des fonctionnalités d’intégration aussi avancées. »

Talend Platform for Big Data
Talend Open Studio for Big Data est un composant essentiel de Talend Platform for Big Data, qui permet aux entreprises d’accroître leur productivité en déployant des solutions de ‘big data’ en quelques heures plutôt que quelques semaines, voire mois. Talend Platform for Big Data intègre aisément des données de tous types – structurées, semi structurées et non structurées – et maximise les ressources de l’entreprise en dissimulant la complexité technique des outils et technologies de Big Data. Talend Platform for Big Data est compatible avec toutes les distributions Apache Hadoop et a été certifiée pour une utilisation avec Hortonworks Data Platform.

Talend Platform for Big Data propose:

Intégration de ‘Big Data’ : charger des ‘big data’ dans Hadoop via HDFS, HBase, Sqoop ou Hive est souvent considéré comme une problématique d’intégration de données opérationnelles. Talend Platform for Big Data fournit un éventail de composants graphiques et d’espaces de travail permettant d’interagir avec une source ou une cible de ‘big data’ sans nécessité d’apprendre et d’élaborer une programmation complexe.

Qualité des ‘Big Data’ : Talend Platform for Big Data propose des fonctions de qualité de données tirant parti de l’environnement massivement parallèle d’Hadoop. La plate-forme permet aux développeurs de capitaliser sur l’environnement de traitement haute performance pour identifier des doublons au sein de ces jeux de données très étendus, en quelques minutes plutôt que quelques jours. Elle prend également en charge les opérations de profiling de ‘big data’, ainsi que d’autres problématiques de qualité, car les fonctions de qualité de données de Talend peuvent être employées pour des projets de ‘big data’.

Optimisation de Projet : Talend Platform for Big Data offre en outre la capacité de planifier, contrôler et déployer tout job de ‘big data’, en tirant parti d’un référentiel partagé pour aider les analystes de données à collaborer et à partager les métadonnées et les objets de leurs projets.

Selon une étude récente de Gartner, Inc. « Les Big Data véhiculent d’importants challenges en matière de gouvernance de l’information. La plupart des données que les entreprises souhaiteront exploiter seront issues de l’extérieur. Celles-ci seront beaucoup moins structurées et maîtrisées (sémantique et relations) que les données transactionnelles qu’elles ont l’habitude de traiter ». Gartner ajoute : « La volonté d’appliquer des techniques analytiques à ces nouveaux types de données (afin surtout de supporter des prises de décision stratégiques) implique des niveaux adéquats de qualité de données. »[1]

Open source : ouvrir la voie à de multiples applications de Big Data
La technologie open source aide les entreprises de toutes tailles à convertir d’énormes jeux de données en intelligence métier. Alors que le déploiement de systèmes propriétaires à travers des environnements étendus et distribués de ‘big data’ est coûteux, les logiciels open source se révèlent beaucoup plus économiques et flexibles que les solutions traditionnelles, et supportent la dimension temps réel, sans augmentation du coût des licences. Ainsi les logiciels open source représentent une technologie de choix pour les applications de ‘big data’.

« Les solutions de big data de Talend offrent une alternative complète et 100% open source, capable de relier Apache Hadoop au reste des applications de l’entreprise. Elles bénéficient en premier lieu aux spécialistes des données en facilitant l’accès et l’analyse de volumes massifs de données » commente Fabrice Bonan, COO et co-fondateur de Talend. « Grâce à la disponibilité de Talend Open Studio for Big Data sous licence Apache et grâce à notre partenariat avec Hortonworks, nous sommes fiers de contribuer à la démocratisation des big data et de simplifier l’intégration d’Hadoop dans des architectures existantes, sans nécessité d’investir des sommes considérables dans des solutions propriétaires non évolutives. »

Disponibilité
Talend Open Studio for Big Data sera disponible à partir de mai 2012. Une version de preview est accessible immédiatement à : http://www.talend.com/download-tibd.




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.