L'Insee choisit la communauté des data scientists de datascience.net pour optimiser les traitements automatiques de ses résultats d'enquêtes en ligne


Rédigé par Communiqué de DataScience.net le 2 Décembre 2014

Pour améliorer la qualité des informations saisies par les personnes qui déclarent leur profession dans les enquêtes réalisées sur internet, l'Institut national de la statistique et des études économiques lance un challenge à la communauté des Data Scientists francophones.



datascience.net, la première plateforme francophone de challenges Big Data, annonce aujourd'hui un nouveau challenge organisé par l'Insee.
L'Insee a choisi la plateforme de challenges pour améliorer la qualité de la saisie en ligne des libellés de profession dans ses formulaires d’enquête. L'institut mise sur l'expertise d'un vivier de talents qui depuis de nombreux mois déjà apporte des solutions innovantes aux challenges Big Data proposés sur la plateforme.

L'innovation pour améliorer les traitements automatiques
Dans le cadre des recensements et enquêtes en ligne, l'Insee recueille des informations sur les personnes interrogées, notamment leur profession. Cependant, une partie des textes (libellés) saisis par les répondants n'est pas directement exploitable pour être traitée par le logiciel de reconnaissance de libellés utilisé par l’Insee et nécessite l'intervention d'un agent de l’institut.
Dans un souci d'innovation, pour améliorer l'efficacité des traitements automatiques, l'Insee souhaite proposer à l'internaute, au moment de la saisie des libellés de profession, des suggestions figurant dans une liste de référence (fournie pour le challenge).

Le challenge
Le challenge consiste à concevoir un algorithme pour améliorer la qualité des informations saisies par les personnes qui déclarent leur profession en ligne.
L'objectif est de proposer à l’internaute, à partir de sa saisie spontanée, trois intitulés de profession parmi lesquels il pourrait choisir celui qui lui convient et qui permet une reconnaissance automatique de l'information ainsi saisie.

A l’issue du challenge, les participants seront invités à un meetup organisé par Datascience.net et par l’Insee. Ce meetup sera l'occasion pour les participants et pour la communauté de se rencontrer, et permettra aux vainqueurs ou à tout ceux qui le souhaitent de venir présenter les méthodes ou les algorithmes qu'ils ont utilisés.

Début du challenge le : 18/11/2014
Fin du challenge le : 19/03/2014

Arnaud Laroche co-fondateur de datascience.net, commente : "L'innovation basée sur la data science s'applique à bon nombre de secteurs. Aujourd'hui l'Insee fait appel à nous ainsi qu'à la communauté des data scientists pour une problématique qui concerne le secteur public, dans le domaine des enquêtes sociales. En se projetant, il est tout à fait raisonnable de penser que dans un avenir proche, elle apportera son expertise et ses solutions à d’autres problématiques, touchant directement le quotidien d’un nombre de plus en plus important de personnes, dans le domaine de la santé par exemple."



Dans la même rubrique :