Alors que nous célébrions aujourd'hui la Journée Mondiale de la Protection des Données, nos concitoyens sont de plus en plus conscients de l'utilisation de leurs données et de l'importance d'éviter toute dérive dans l'utilisation de ces dernières. C'est pourquoi Le Voice Lab lance sa première campagne de Data funding, avec pour principal objectif de collecter 2 000 heures de données vocales. Grâce à cette opération, les utilisateurs peuvent partager leurs données vocales et aider ainsi la recherche, ainsi que l'ensemble de l'écosystème numérique de la voix et l'innovation en France, en Europe et dans le monde francophone.
« Le Message que nous souhaitons transmettre aux utilisateurs de Google Home, Alexa ou Siri l'appel suivant : les données de votre assistant vocal vous appartiennent. Faites-en don à la recherche française ! », explique Karel Bourgois, Président du Voice Lab. « Aujourd'hui, de plus en plus de personnes souhaitent bénéficier d'appareils avec lesquels elles peuvent réellement communiquer naturellement. Pour développer de tels systèmes il est nécessaire d'accéder à des données vocales libres. C'est pourquoi nous lançons une campagne de data funding citoyen dans le respect des données personnelles. Chaque participant est invité à partager les données vocales stockées chez les GAFAM dans une marketplace française ! Celles-ci permettront à l'écosystème vocal français de développer des technologies souveraines indépendantes des géants du numérique que sont les GAFAM et BATX. Cet acte citoyen permettra de soutenir l'écosystème vocal français et le développement d'une technologie vocale diverse, dynamique et souveraine. »
Les données utilisateurs ont de la valeur. Le Voice Lab souhaite sensibiliser les citoyens sur la pleine propriété qu'ils gardent sur les données recueillies par les différents services d'Assistants Vocaux tels que Google Home, Alexa ou Siri. Le Voice Lab permet aujourd'hui aux citoyens de décider qui peut disposer de leurs données vocales et pour quels objectifs.
Devenus incontournables, les assistants vocaux sur enceintes connectées ou sur d'autres canaux vocaux comme le téléphone, reposent sur des moteurs de reconnaissance de la parole entraînés sur de très grands jeux de données récoltées auprès des utilisateurs lors de leurs interactions et auxquels seules quelques grandes entreprises ont accès. Grâce à l'opération de Data funding du Voice Lab, les utilisateurs peuvent dorénavant partager leurs données vocales et aider ainsi la recherche, ainsi que l'ensemble de l'écosystème numérique de la voix et l'innovation en France, en Europe et dans le monde francophone.
Le Voice Lab et Datafunding ont mis en place un site web qui permet très simplement à chaque utilisateur de donner son consentement au Voice Lab afin que celui-ci puisse récupérer ses données vocales auprès des éditeurs des assistants vocaux. Cet outil permet de gérer les consentements et de les révoquer automatiquement, si l'utilisateur décide d'arrêter sa contribution au Voice Lab.
Une fois récoltées les données sont anonymisées et normalisées pour contribuer aux corpus et créer des modèles de transcription indépendants et contributifs.
L'objectif principal est bien de mutualiser les données et de concevoir des modèles de reconnaissance vocale en langue française pour alimenter différents services de transcription automatique de la parole, entre autres open source. Les moteurs permettent ainsi aux différents acteurs - académiques, privés ou publics - de créer des services ou des produits vocaux en toute indépendance des GAFAM. Les laboratoires Français pourront ainsi lever de nombreux verrous, en particulier liés au volume et à la diversité des données disponibles.
La mission du Voice Lab est de créer une alternative aux solutions et aux modèles économiques existants, afin de garantir d'un côté le respect de la vie privée des utilisateurs et de l'autre de prévenir une dépendance économique aux GAFA et BATX sur les interfaces vocales qui seront les interfaces du futur.
Les données seront hébergées par Le Voice Lab (levoicelab.org) dans le strict respect de la vie privée et du droit relatif à la protection des données personnelles.
Le Voice Lab souhaite avant tout garantir que les données des utilisateurs seront utilisées en respectant les valeurs de l'IA éthique by design, telles que le respect, la transparence, la loyauté, la sécurité, l'équité et la maîtrise.
Cette campagne est l'occasion de communiquer auprès du grand public et de faire connaître cette initiative européenne auprès des citoyens.
Quelques exemples de produits et services qui pourront être créés par les membres du Voice Lab grâce à ces données :
● Des applications de la reconnaissance vocale qui s'imposent dans de nombreux domaines métiers et sont par ailleurs à la base d'avancées en termes d'accessibilités (handicap visuel et auditif, illectronisme) ;
● Création d'assistants vocaux embarqué ;
● Compréhension des conversations téléphoniques avec un téléconseiller ;
● Création d'assistants vocaux pour téléphone ou enceinte connectée ;
● Aide aux malentendants ;
● Sous-titrage et veille médias ;
● Etc.
« Le Message que nous souhaitons transmettre aux utilisateurs de Google Home, Alexa ou Siri l'appel suivant : les données de votre assistant vocal vous appartiennent. Faites-en don à la recherche française ! », explique Karel Bourgois, Président du Voice Lab. « Aujourd'hui, de plus en plus de personnes souhaitent bénéficier d'appareils avec lesquels elles peuvent réellement communiquer naturellement. Pour développer de tels systèmes il est nécessaire d'accéder à des données vocales libres. C'est pourquoi nous lançons une campagne de data funding citoyen dans le respect des données personnelles. Chaque participant est invité à partager les données vocales stockées chez les GAFAM dans une marketplace française ! Celles-ci permettront à l'écosystème vocal français de développer des technologies souveraines indépendantes des géants du numérique que sont les GAFAM et BATX. Cet acte citoyen permettra de soutenir l'écosystème vocal français et le développement d'une technologie vocale diverse, dynamique et souveraine. »
Les données utilisateurs ont de la valeur. Le Voice Lab souhaite sensibiliser les citoyens sur la pleine propriété qu'ils gardent sur les données recueillies par les différents services d'Assistants Vocaux tels que Google Home, Alexa ou Siri. Le Voice Lab permet aujourd'hui aux citoyens de décider qui peut disposer de leurs données vocales et pour quels objectifs.
Devenus incontournables, les assistants vocaux sur enceintes connectées ou sur d'autres canaux vocaux comme le téléphone, reposent sur des moteurs de reconnaissance de la parole entraînés sur de très grands jeux de données récoltées auprès des utilisateurs lors de leurs interactions et auxquels seules quelques grandes entreprises ont accès. Grâce à l'opération de Data funding du Voice Lab, les utilisateurs peuvent dorénavant partager leurs données vocales et aider ainsi la recherche, ainsi que l'ensemble de l'écosystème numérique de la voix et l'innovation en France, en Europe et dans le monde francophone.
Le Voice Lab et Datafunding ont mis en place un site web qui permet très simplement à chaque utilisateur de donner son consentement au Voice Lab afin que celui-ci puisse récupérer ses données vocales auprès des éditeurs des assistants vocaux. Cet outil permet de gérer les consentements et de les révoquer automatiquement, si l'utilisateur décide d'arrêter sa contribution au Voice Lab.
Une fois récoltées les données sont anonymisées et normalisées pour contribuer aux corpus et créer des modèles de transcription indépendants et contributifs.
L'objectif principal est bien de mutualiser les données et de concevoir des modèles de reconnaissance vocale en langue française pour alimenter différents services de transcription automatique de la parole, entre autres open source. Les moteurs permettent ainsi aux différents acteurs - académiques, privés ou publics - de créer des services ou des produits vocaux en toute indépendance des GAFAM. Les laboratoires Français pourront ainsi lever de nombreux verrous, en particulier liés au volume et à la diversité des données disponibles.
La mission du Voice Lab est de créer une alternative aux solutions et aux modèles économiques existants, afin de garantir d'un côté le respect de la vie privée des utilisateurs et de l'autre de prévenir une dépendance économique aux GAFA et BATX sur les interfaces vocales qui seront les interfaces du futur.
Les données seront hébergées par Le Voice Lab (levoicelab.org) dans le strict respect de la vie privée et du droit relatif à la protection des données personnelles.
Le Voice Lab souhaite avant tout garantir que les données des utilisateurs seront utilisées en respectant les valeurs de l'IA éthique by design, telles que le respect, la transparence, la loyauté, la sécurité, l'équité et la maîtrise.
Cette campagne est l'occasion de communiquer auprès du grand public et de faire connaître cette initiative européenne auprès des citoyens.
Quelques exemples de produits et services qui pourront être créés par les membres du Voice Lab grâce à ces données :
● Des applications de la reconnaissance vocale qui s'imposent dans de nombreux domaines métiers et sont par ailleurs à la base d'avancées en termes d'accessibilités (handicap visuel et auditif, illectronisme) ;
● Création d'assistants vocaux embarqué ;
● Compréhension des conversations téléphoniques avec un téléconseiller ;
● Création d'assistants vocaux pour téléphone ou enceinte connectée ;
● Aide aux malentendants ;
● Sous-titrage et veille médias ;
● Etc.