Avec MLflow Model Registry, Databricks simplifie la gestion des modèles de Machine Learning à grande échelle


Rédigé par Communiqué de Databricks le 17 Octobre 2019

Avec plus de 140 contributeurs et 800K téléchargements mensuels MLflow offrent aux utilisateurs un répertoire central de modèles pour accélérer les déploiements de Machine Learning.



Databricks, leader de l’analytique unifiée, annonce Model Registry, nouvelle fonction au sein de la plateforme open source MLflow créée par Databricks et dédiée au cycle de vie du machine learning (ML). Ce nouveau composant permet un processus de gestion de modèles complet en fournissant aux data scientists et aux ingénieurs un répertoire central pour tracer, partager, et collaborer sur les modèles de ML. Model Registry gère tout le cycle de vie des modèles et leurs étapes de transition de l’expérimentation jusqu’à la simulation et le déploiement. Depuis son lancement lors du Spark+AI Summit 2018, le projet MLflow compte plus de 140 contributeurs et 800 000 téléchargements mensuels, ce qui en fait la solution leader de gestion de cycle de vie du ML.









MLflow Model Registry





« Tous ceux qui ont essayé de développer du machine learning savent que c’est complexe. La capacité de gérer les modèles et leurs versions, et de les partager est essentielle pour minimiser la confusion, car le nombre de modèles à un moment donné en phase d'expérimentation, de test et de production peut atteindre des milliers », explique Matei Zaharia, cofondateur et CTO de Databricks. « Les nouvelles fonctionnalités de MLflow, développées en collaboration avec des centaines de contributeurs, permettent aux organisations du monde entier d'améliorer le développement et le déploiement de ML. Avec des centaines de milliers de téléchargements mensuels, nous sommes encouragés par l'impact positif des contributions de la communauté."



L'offre MLflow de Databricks permet déjà d'enregistrer les indicateurs, les paramètres et les artefacts dans le cadre d'expériences, de modèles de packages et de projets ML reproductibles. Elle permet aussi de fournir des options de déploiement flexibles au sein de la plate-forme, et de tout service ou conteneur d'inférence dans le cloud. Le MLflow Model Registry s'appuie sur ces capacités en permettant aux organisations de collaborer sur des modèles et d'optimiser le cycle de développement des modèles ML au fur et à mesure qu'ils passent d'une phase de connexion au déploiement réel :



Un point central de collaboration : MLflow Model Registry facilite le partage de l'expertise et des connaissances au sein des équipes de développement, lors de la conception et du déploiement de modèles de ML. L’outil rend les modèles plus faciles à découvrir et fournit des fonctionnalités collaboratives pour améliorer collectivement les tâches ML communes.
Pipelines CI/CD flexibles : MLflow Model Registry permet aux équipes de garder le contrôle des modèles de ML en transférant automatiquement un modèle en production sur la base de conditions prédéfinies, ou en contrôlant et validant manuellement les changements d'étapes du cycle de vie des modèles, de la phase d'expérimentation jusqu’aux tests et à la production.
Visibilité et gouvernance : les grandes entreprises ont souvent et à tout moment des milliers de modèles de ML dans leurs phases d'expérimentation, d'essai et de production. MLflow Model Registry offre une visibilité complète et permet la gouvernance de chacun des modèles en gardant une trace de l'historique des modèles et en gérant qui peut approuver les modifications.


Model Registry est disponible sur la plateforme Databricks et offre les avantages de sa plate-forme Unified Data Analytics, tels que la sécurité au niveau de toute l'entreprise, le passage à l’échelle et les contrôles d'accès granulaires. Dans le cadre de l'offre open source MLflow, le composant Model Registry est désormais également accessible à la communauté open source via GitHub. Pour plus d'informations sur MLflow : www.databricks.com/mlflow.



Dans la même rubrique :