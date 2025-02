Confluent, Inc. (NASDAQ : CFLT), pionnier du data streaming, et Databricks, l’entreprise spécialisée en Data et IA, annoncent aujourd’hui une expansion majeure de leur partenariat. Cette alliance combine la Data Streaming Platform complète de Confluent et la Data Intelligence Platform de Databricks pour permettre aux entreprises de tirer parti des données en temps réel afin d’alimenter leurs prises de décision basées sur l’IA. Grâce à de nouvelles intégrations entre Tableflow de Confluent et Unity Catalog de Databricks, les entreprises pourront assurer une gouvernance fluide des données entre les systèmes opérationnels et analytiques, et ainsi développer plus efficacement des applications basées sur l’IA.



Relever le défi des données pour l’IA



Les entreprises développent rapidement des applications d’IA qui nécessitent des données fiables et en temps réel pour optimiser la prise de décision et améliorer l’expérience client. Pourtant, seules 22 % d’entre elles estiment que leur infrastructure informatique actuelle est prête à supporter ces nouvelles applications d’IA. Un obstacle majeur demeure : la séparation entre les systèmes opérationnels, où les données sont générées, et les systèmes analytiques, où ces données sont transformées en insights exploitables.



Cette déconnexion entraîne l’application de processus et d’outils distincts entre les deux systèmes, empêchant ainsi l’exploitation efficace des données en temps réel. Par conséquent, les équipes peinent à combiner ces données avec d’autres systèmes de manière pertinente, rendant impossible l’innovation en IA sur des cas d’usage avancés.



« Pour maximiser le retour sur investissement de leurs projets d’IA, les entreprises doivent centraliser leurs data et IA analytics et leur gouvernance au sein d’une même plateforme » explique Ali Ghodsi, co-fondateur et CEO de Databricks. « En développant la data intelligence, nous mettons les données de confiance au cœur des organisations. Nous sommes ravis que Confluent ait adopté Unity Catalog et Delta Lake comme solutions ouvertes de gouvernance et de stockage, et nous nous réjouissons de cette collaboration pour offrir une valeur ajoutée durable à nos clients. »



« Les données en temps réel sont le moteur de l’IA » ajoute Jay Kreps, co-fondateur et CEO de Confluent. « Pourtant, les entreprises sont encore trop souvent freinées par des systèmes cloisonnés, incapables de fournir les données nécessaires, sous la bonne forme et au bon moment. Avec Databricks, nous leur permettons enfin d’exploiter pleinement le potentiel des données en temps réel pour concevoir des applications IA sophistiquées adaptées à leurs cas d’usage stratégiques. »



Des données en temps réel, prêtes pour l’IA



Pour surmonter ces défis, Confluent et Databricks annoncent de nouvelles intégrations garantissant une interopérabilité en temps réel et facilitant la collaboration entre toutes les équipes d’une entreprise. Une intégration bidirectionnelle entre Tableflow de Confluent et Delta Lake de Databricks, combinée à Unity Catalog, une solution unifiée et ouverte de gouvernance des données et de l’IA, garantira une gestion cohérente des données opérationnelles et analytiques en temps réel.



Delta Lake, couche de stockage en open format développée par Databricks, a été initialement conçue pour les cas d’usage en streaming, avec des écritures ultra-rapides. Il s’agit désormais du format lakehouse le plus adopté au monde, avec plus de 10 exabytes de données traitées quotidiennement. Avec cette intégration, Tableflow et Delta Lake permettent aux entreprises d’exploiter immédiatement leurs données opérationnelles au sein de l’écosystème Delta Lake.



Les clients de Confluent et Databricks pourront ainsi utiliser n’importe quel moteur ou outil IA—tels que Apache Spark™, Trino, Polars, DuckDB et Daft—directement sur leurs données au sein d’Unity Catalog.



Par ailleurs, des intégrations sur mesure entre Tableflow et Unity Catalog permettront d’associer automatiquement des métadonnées aux données échangées entre les plateformes. Cette approche garantit que les données opérationnelles sont facilement exploitables par les data scientists et analystes sur Databricks, tout en assurant que les données analytiques restent accessibles aux développeurs d’applications et ingénieurs du streaming sur Confluent. De plus, la suite de gouvernance de flux de Confluent fournira une gouvernance avancée en amont, un lignage de bout en bout et un contrôle automatisé de la qualité des données au sein d’Unity Catalog.





« L'exploitation de la proximité des sources de production est un facteur clé non seulement dans le secteur de l'énergie, mais aussi dans le domaine des données » explique Dr. Dora Simroth, Head of Data and AI Engineering chez E.ON Digital Technology. « Confluent et Databricks sont déjà des technologies essentielles dans notre Data et AI stack. Ces intégrations permettront à nos équipes de travailler sur une source unique de données bien définies et actualisées en continu, tant pour nos opérations que pour nos analyses. En collaborant, Confluent et Databricks nous ouvrent un chemin plus rapide vers la création de solutions numériques centrées sur la donnée et les modèles IA. »







Grâce à ces nouvelles capacités, les données opérationnelles issues de Confluent deviennent des éléments de premier plan dans Databricks, et les données de Databricks sont accessibles par tout processeur au sein de l’entreprise. Les sujets de streaming consommés par les applications IA et les tables utilisées par les analystes de données auront désormais une vision homogène et synchronisée des mêmes données en temps réel, permettant ainsi des prises de décisions plus rapides et plus intelligentes. Cette intégration fluide entre applications d’entreprise, analytique et gouvernance est essentielle pour innover à grande échelle avec l’IA.