Snowflake lance une nouvelle version de son connecteur Spark qui permet de traiter 14 fois plus rapidement les requêtes

Snowflake, la plateforme de données dans le cloud annonce le lancement de la version 2.6.0 du Snowflake Connector for Spark (Spark Connector) permettant d'utiliser le format de restitution en colonne Apache Arrow qui améliore considérablement les performances de lecture des requêtes. Cette évolution permet de rendre ces dernières jusqu’à quatorze fois plus performantes suivant l'utilisation des caches de données de Snowflake, elle aussi rendue possible par ce nouveau connecteur.

Cette nouvelle version du Snowflake Spark Connector exécute les requêtes directement via JDBC (Java Database Connectivity) et désérialise les données en utilisant Apache Arrow, le nouveau format de restitution des requêtes de Snowflake, côté client. Celui-ci permet de gagner du temps dans la lecture des données et d'utiliser les résultats des requêtes en cache. L'usage de ce nouveau connecteur apporte un gain de performance quatre fois supérieur pour les travaux de requêtage sur Spark de bout en bout par rapport à la version précédente. Cette amélioration est due à un gain de performance équivalent à 10 fois moins de temps passé par le connecteur Spark pour aller chercher et traiter les résultats de la requête Snowflake.

De plus, Snowflake dispose d'un cache de résultats de requêtes répétées. En stockant les résultats qui peuvent être réutilisés, la base de données peut éviter le recalcul et ordonner simplement au pilote du client de lire les résultats déjà calculés dans le cache. Dans les versions précédentes du Spark Connector, ce cache de résultats de requêtes n'était pas utilisable. C'est l'usage combiné du format Apache Arrow et du cash de requêtes qui permet au nouveau connecteur de multiplier les performances par 14.

Autres articles

Abonnez-vous gratuitement à Decideo !

Snowflake lance une nouvelle version de son connecteur Spark qui permet de traiter 14 fois plus rapidement les requêtes

La version 2.6.0 du Spark Connector de Snowflake permet d'utiliser le format de restitution Apache Arrow et les données de requêtes en cache de Snowflake pour augmenter considérablement les performances de traitement.

Ippon Technologies devient “Partenaire Premier” de Snowflake

Snowflake nomme Elise Delsol au poste de Directrice Partenaires France

Domo étend ses capacités d'intégration native dans Snowflake Data Cloud

CORA France accélère ses projets Big Data avec Semarchy et Snowflake

Un nouveau rapport Snowflake révèle qu'une moyenne de 90 applications d'IA par jour on été créées en 2023

Semarchy multiplie les initiatives pour améliorer l’expérience de ses clients, de ses partenaires et de ses collaborateurs - 16/05/2024

Alteryx dévoile un assistant IA conçu pour permettre aux utilisateurs de créer des flux de travail analytiques en toute transparence - 16/05/2024

SIGMA annonce le lancement de LIXA CSRD, sa nouvelle offre de reporting extra-financier à destination des entreprises - 15/05/2024

ABBYY améliore sa Marketplace pour répondre à la demande croissante de données pour les LLM et simplifier l'intégration des RAG - 15/05/2024

Dremio Cloud, solution de Data Lakehouse permettant d’accéder et de diffuser les données en self-service, est désormais disponible sur Microsoft Azure - 14/05/2024