Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg

Starburst, la société derrière Trino, annonce une série de nouvelles fonctionnalités pour Galaxy, sa plateforme lakehouse SaaS hybride et ouverte, basée sur le projet open source Trino. Les nouvelles capacités annoncées permettent à la fois l'ingestion en streaming entièrement gérée depuis Apache Kafka vers des tables Apache Iceberg, l'ingestion automatique de fichiers depuis Amazon Web Services (AWS) S3 vers des tables Iceberg, ainsi que de nombreuses améliorations en matière de performance et d’optimisation du rapport performance/prix de la plateforme lakehouse.

« Grâce à nos nouvelles capacités d’ingestion vers Iceberg, nos clients n'ont plus à se préoccuper de la quantité ou de la vitesse des données entrantes dans leurs data lakes », déclare Tobias Ternstrom, Chief Product Officer chez Starburst. « Avec une ingestion de 100 Gb/s, Galaxy répond aux besoins les plus exigeants, sans coûts excessifs ni contraintes de configuration. »

Starburst Galaxy intègre l’ingestion en continu depuis Kafka, qui permet aux entreprises de configurer en quelques minutes des pipelines entièrement gérés pour transférer les données de Kafka vers Iceberg. Compatible avec des systèmes conformes à Kafka, tels que Confluent Cloud et Amazon MSK, cette solution assure un traitement fiable à un débit de 100 Gb par seconde, sans doublons ni pertes de données. Pour les utilisateurs d’Amazon S3, Starburst proposera également une ingestion automatisée de fichiers, qui optimise les performances de lecture grâce à des opérations automatiques de compaction et de gestion des snapshots, rendant les données disponibles pour les requêtes en une minute environ.

Starburst a également enrichi les capacités d’auto-scaling de Galaxy pour une gestion intelligente des ressources dans les environnements à forte concurrence d’utilisateurs, où les besoins en calcul fluctuent constamment. Désormais, Galaxy surveille les requêtes actives et en attente, ce qui permet une allocation de ressources 50 % plus rapide par requête. Le système peut également réactiver automatiquement les nœuds de calcul en fin de cycle pour optimiser l’efficacité.

La nouvelle génération de cache de Starburst Galaxy est conçue pour alléger les tâches de préparation de données souvent fastidieuses pour les data engineers, en améliorant la performance des requêtes jusqu’à 62 %. Basée sur la technologie Warp Speed, elle automatise une partie des processus et permet de gérer efficacement la montée en charge et la stabilité des requêtes pour les outils de BI et de dashboarding. Warp Speed utilise une indexation intelligente et une mise en cache avancée pour optimiser les résultats intermédiaires des charges de travail et identifier les motifs de sous-requêtes similaires.

La fonctionnalité de routage basé sur les rôles utilisateurs de Starburst Galaxy simplifie l’allocation des ressources selon le type de cluster. Les utilisateurs n’ont plus besoin de choisir le cluster adapté pour chaque requête et les administrateurs peuvent désormais affecter facilement des groupes en fonction des rôles et privilèges. Ce routage automatisé dirige les requêtes vers le cluster approprié selon des règles prédéfinies, le tout via une URL unique, limitant ainsi les interventions manuelles et optimisant l’efficacité des opérations.

« Dans une économie numérique en quête de performances d’analyses optimisées et de coûts maîtrisés, Starburst répond à un besoin crucial : fournir une ingestion de données en continu simple, évolutive, et basée sur des standards ouverts comme Apache Iceberg, » explique Sanjeev Mohan, fondateur de SanjMo. « Cette innovation de Starburst est une avancée majeure pour les entreprises en quête de scalabilité, de simplicité et d’optimisation budgétaire. »

Autres articles

Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg

La plateforme de Starburst permet de passer de l’ingestion de données à des analyses SQL en temps quasi réel.

Starburst dévoile l’Enterprise Intelligence Platform à AI+Datanova, offrant aux entreprises une voie plus rapide vers une IA de confiance

Avec Stargate, Starburst fait du multicloud une réponse à la conformité

Starburst annonce la prise en charge dès le lancement du CPU NVIDIA Vera pour l’inférence IA et l’analytique

Starburst dépasse les 100 millions de dollars d’ARR alors que sa solution d’IA pour l’entreprise s’attaque à la BI

Starburst étend les data products Iceberg aux environnements on-premises et hybrides

Snowflake obtient la certification "Hébergeur de Données de Santé" en France pour accélérer les usages de la donnée et de l’IA dans le secteur - 25/06/2026

De l’avenir de Teradata... - 09/03/2026

MongoDB étend ses capacités de recherche et de recherche vectorielle à ses offres autogérées - 20/09/2025

Neo4j lance Infinigraph: la base de données de graphes la plus scalable pour unifier les charges opérationnelles et analytiques à l’échelle de 100 To+ - 04/09/2025

MongoDB renforce sa plateforme et son écosystème pour les applications IA - 28/08/2025