Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


Starburst intègre les DataFrames Python pour simplifier et étendre la transformation des données


Rédigé par Communiqué de Starburst le 13 Septembre 2023

Les nouvelles bibliothèques PyStarburst et Ibis permettent de créer des pipelines de transformation complexes et de construire des applications de données avec Starburst Galaxy.



Starburst, la plateforme analytique du data lake, annonce étendre sa prise en charge du langage de programmation Python avec PyStarburst et une nouvelle intégration avec la bibliothèque Python open source Ibis, construite en collaboration avec Voltron Data, constructeur de systèmes de données composables et mainteneur d'Ibis.

Cela signifie que les développeurs et les data engineers utilisant Starburst et Trino n'ont plus besoin de décharger les données vers des frameworks tels que PySpark et Snowpark pour gérer des workloads complexes. Les équipes peuvent désormais exploiter un moteur MPP unique et puissant pour leurs workloads analytiques et de transformation, réduisant ainsi le coût et la complexité de leur environnement de données.

PyStarburst fournit une syntaxe familière à PySpark et Snowpark pour écrire et exécuter des pipelines ETL et des transformations de données pour la production. Cela facilite la construction de nouveaux pipelines avec PyStarburst ainsi que la migration de pipelines PySpark et Snowpark existants vers Starburst, et ce sans réécriture de code.

“De nombreux data engineers privilégient l'écriture de code plutôt que le SQL pour les transformations et de nombreux ingénieurs logiciels ont l'habitude de construire des applications de données avec Python”, a déclaré Martin Traverso, CTO de Starburst. “Avec PyStarburst, nous leur donnons la liberté de le faire en bénéficiant de la productivité et des performances avancées de la solution d’entreprise Starburst basée sur Trino.”



Pour les développeurs et les data engineers qui cherchent à créer des applications de données scalable, la nouvelle intégration Ibis fournit une API Python uniforme capable d'exécuter des requêtes sur plus de 18 moteurs différents, y compris DuckDB, pandas, PostgreSQL, et désormais Starburst Galaxy. Cela signifie qu’il est possible de passer du développement sur un ordinateur portable à la production dans Galaxy, sans réécrire une seule ligne de code.

Cette collaboration entre Ibis et Starburst Galaxy permet aux utilisateurs d'écrire du code Python portable qui s'exécute sur le moteur d'analyse de data lake de Starburst, en opérant sur des données provenant de plus de 50 sources prises en charge.

“Les utilisateurs de Python rencontrent des difficultés pour combler le fossé entre les prototypes sur leurs ordinateurs portables et les applications de production fonctionnant sur des plateformes telles que Starburst Galaxy. Ibis permet de combler ce fossé beaucoup plus facilement”, a déclaré Josh Patterson, CEO de Voltron Data. “Avec Ibis, il est possible d'écrire du code Python une seule fois et de l'exécuter n'importe où, avec n'importe quel moteur d'exécution backend pris en charge. L'utilisateur peut passer en toute transparence du crunching de quelques gigaoctets de données de test sur son ordinateur portable au crunching à l'échelle de pétaoctets de données en production à l'aide de Starburst Galaxy.”





Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store