Le défi des données annotées



"Disposer de grandes quantités de données de qualité est indispensable pour améliorer les performances des modèles d’IA. Dans le domaine de la vision par ordinateur, les tâches de nettoyage et d’annotation de ces données sont souvent longues, fastidieuses et coûteuses en temps, notamment parce qu’elles sont faites manuellement. Cette préparation des données peut considérablement ralentir les cycles de développement des IAs et détourner les Data Scientists de leur cœur de métier : l’analyse et la valorisation des données", explique Stefan Duffner, docteur en informatique au LIRIS.



Automatiser l’annotation permettra d’accélérer les cycles de développement d’IA

Financé dans le cadre du programme R&D Booster de la Région Auvergne-Rhône-Alpes, le projet DATAWISE vise à développer des technologies innovantes qui permettront d’automatiser les tâches d'annotation et de nettoyage des données. Cette collaboration entre Neovision et le LIRIS accélèrera ainsi les cycles de développement des modèles d'IA tout en améliorant leurs performances et en limitant les biais. Grâce à cette automatisation, les Data Scientists pourront se concentrer sur des tâches à plus forte valeur ajoutée, telles que l'analyse des données et l'optimisation des algorithmes, sans être freinés par les étapes répétitives de préparation des données.



Un partenariat stratégique



Le projet DATAWISE réunit des acteurs de premier plan dans leurs domaines respectifs. Neovision, une entreprise grenobloise spécialisée dans le développement de solutions d'IA sur mesure, et le LIRIS, laboratoire de recherche basé à Lyon, expert scientifique en matière de traitement de l’information, d’images et de systèmes d’information. Ce partenariat allie savoir-faire technique et avancées académiques pour créer une solution robuste, capable de répondre aux défis complexes du développement de l’IA moderne.

“Les IA dédiées au traitement d'images sont souvent initialement entraînées sur des tâches simples, comme la reconnaissance de chiens ou de chats, avant de passer à des objets plus complexes. Cette méthode d'apprentissage limite parfois leurs performances. Notre ambition est de développer des modèles capables de s'entraîner directement sur des données industrielles complexes, sans nécessiter une préparation manuelle massive des données.

Cela représente un bond en avant significatif en matière de performance et accélère considérablement le processus de création de solutions d'IA”, explique Lucas Nacsa, CEO de Neovision.



Une solution pour l’avenir de l’IA

Avec DATAWISE, Neovision et le LIRIS entendent transformer la manière dont les données visuelles, telles que des photos, sont préparées pour être traitées par les modèles d’IA. Le projet ouvrira de nouvelles perspectives pour tous les secteurs industriels, en leur

permettant de valoriser des bases de données jusqu’ici inexploitées à moindre coût. Les technologies développées dans le cadre de DATAWISE rendront les solutions d’intelligence artificielle plus accessibles à l’ensemble des entreprises, renforçant ainsi leur compétitivité. À terme, l'intégration de grands modèles de langage (LLM) aux outils issus de DATAWISE, optimisera l’ergonomie et encouragera une adoption plus large de ces solutions par les utilisateurs.