Snowflake lance une nouvelle version de son connecteur Spark qui permet de traiter 14 fois plus rapidement les requêtes

Snowflake, la plateforme de données dans le cloud annonce le lancement de la version 2.6.0 du Snowflake Connector for Spark (Spark Connector) permettant d'utiliser le format de restitution en colonne Apache Arrow qui améliore considérablement les performances de lecture des requêtes. Cette évolution permet de rendre ces dernières jusqu’à quatorze fois plus performantes suivant l'utilisation des caches de données de Snowflake, elle aussi rendue possible par ce nouveau connecteur.

Cette nouvelle version du Snowflake Spark Connector exécute les requêtes directement via JDBC (Java Database Connectivity) et désérialise les données en utilisant Apache Arrow, le nouveau format de restitution des requêtes de Snowflake, côté client. Celui-ci permet de gagner du temps dans la lecture des données et d'utiliser les résultats des requêtes en cache. L'usage de ce nouveau connecteur apporte un gain de performance quatre fois supérieur pour les travaux de requêtage sur Spark de bout en bout par rapport à la version précédente. Cette amélioration est due à un gain de performance équivalent à 10 fois moins de temps passé par le connecteur Spark pour aller chercher et traiter les résultats de la requête Snowflake.

De plus, Snowflake dispose d'un cache de résultats de requêtes répétées. En stockant les résultats qui peuvent être réutilisés, la base de données peut éviter le recalcul et ordonner simplement au pilote du client de lire les résultats déjà calculés dans le cache. Dans les versions précédentes du Spark Connector, ce cache de résultats de requêtes n'était pas utilisable. C'est l'usage combiné du format Apache Arrow et du cash de requêtes qui permet au nouveau connecteur de multiplier les performances par 14.

Autres articles

Snowflake lance une nouvelle version de son connecteur Spark qui permet de traiter 14 fois plus rapidement les requêtes

La version 2.6.0 du Spark Connector de Snowflake permet d'utiliser le format de restitution Apache Arrow et les données de requêtes en cache de Snowflake pour augmenter considérablement les performances de traitement.

Open Semantic Interchange devient Apache Ossie et rejoint le programme Apache Incubator

Sanofi choisit Snowflake pour accélérer le développement de médicaments avec l’IA

Snowflake ouvre un nouveau bureau en France pour accélérer l’innovation autour des données et de l’IA

Snowflake obtient la certification "Hébergeur de Données de Santé" en France pour accélérer les usages de la donnée et de l’IA dans le secteur

Snowflake renforce sa collaboration avec AWS avec un investissement de 6 milliards de dollars

Databricks et Microsoft élargissent leur partenariat pour aider les entreprises à intégrer le contexte métier à l'IA d'entreprise - 24/07/2026

Comment exploiter la data pour optimiser son entrepôt à 100 % : 5 clés pour un pilotage agile - 23/07/2026

Nouveau convertisseur CAO pour le Digital Thread : la qualité des données, fondement de la continuité numérique - 22/07/2026

VISEO collabore avec Rockwell Automation pour intégrer l’exécution industrielle en temps réel - 21/07/2026

Gurobi lance l’Intelligence Hub afin de rendre l’optimisation mathématique plus accessible à l’aide de l’IA - 21/07/2026