Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


L'Insee choisit la communauté des data scientists de datascience.net pour optimiser les traitements automatiques de ses résultats d'enquêtes en ligne


Rédigé par Communiqué de DataScience.net le 2 Décembre 2014

Pour améliorer la qualité des informations saisies par les personnes qui déclarent leur profession dans les enquêtes réalisées sur internet, l'Institut national de la statistique et des études économiques lance un challenge à la communauté des Data Scientists francophones.



datascience.net, la première plateforme francophone de challenges Big Data, annonce aujourd'hui un nouveau challenge organisé par l'Insee.
L'Insee a choisi la plateforme de challenges pour améliorer la qualité de la saisie en ligne des libellés de profession dans ses formulaires d’enquête. L'institut mise sur l'expertise d'un vivier de talents qui depuis de nombreux mois déjà apporte des solutions innovantes aux challenges Big Data proposés sur la plateforme.

L'innovation pour améliorer les traitements automatiques
Dans le cadre des recensements et enquêtes en ligne, l'Insee recueille des informations sur les personnes interrogées, notamment leur profession. Cependant, une partie des textes (libellés) saisis par les répondants n'est pas directement exploitable pour être traitée par le logiciel de reconnaissance de libellés utilisé par l’Insee et nécessite l'intervention d'un agent de l’institut.
Dans un souci d'innovation, pour améliorer l'efficacité des traitements automatiques, l'Insee souhaite proposer à l'internaute, au moment de la saisie des libellés de profession, des suggestions figurant dans une liste de référence (fournie pour le challenge).

Le challenge
Le challenge consiste à concevoir un algorithme pour améliorer la qualité des informations saisies par les personnes qui déclarent leur profession en ligne.
L'objectif est de proposer à l’internaute, à partir de sa saisie spontanée, trois intitulés de profession parmi lesquels il pourrait choisir celui qui lui convient et qui permet une reconnaissance automatique de l'information ainsi saisie.

A l’issue du challenge, les participants seront invités à un meetup organisé par Datascience.net et par l’Insee. Ce meetup sera l'occasion pour les participants et pour la communauté de se rencontrer, et permettra aux vainqueurs ou à tout ceux qui le souhaitent de venir présenter les méthodes ou les algorithmes qu'ils ont utilisés.

Début du challenge le : 18/11/2014
Fin du challenge le : 19/03/2014

Arnaud Laroche co-fondateur de datascience.net, commente : "L'innovation basée sur la data science s'applique à bon nombre de secteurs. Aujourd'hui l'Insee fait appel à nous ainsi qu'à la communauté des data scientists pour une problématique qui concerne le secteur public, dans le domaine des enquêtes sociales. En se projetant, il est tout à fait raisonnable de penser que dans un avenir proche, elle apportera son expertise et ses solutions à d’autres problématiques, touchant directement le quotidien d’un nombre de plus en plus important de personnes, dans le domaine de la santé par exemple."




Commentaires

1.Posté par Philippe NIEUWBOURG le 02/12/2014 22:24
En France, le Data Scientist vaut de moins en moins cher !
Après le challenge controversé de la SNCF récompensé par des bons de voyage, DataScience.net et l'INSEE poursuivent dans la voie du moins disant avec un "challenge pédagogique", qui signifie "gratuit", où vous pouvez passer des heures à définir de nouveaux algorithmes pour l'INSEE, sans espérer gagner un centime. La France est-elle la Chine de la science des données ?

Et après on s'étonne que les "cerveaux" partent à l'étranger. En Amérique du Nord, un Data Scientist est payé plus de 100 000 $ par an, en France, il participe à des "challenges" :-(

2.Posté par Renaud Finaz de Villaine le 03/12/2014 16:43
Revenant de Californie où j'ai rencontré quelques Data Scientist, je dirai que le salaire d'un débutant dans la Silicon Valley est plutôt de l'ordre de 150 000/200 000$ par an, évoluant très vite vers 400 000 $ pour un confirmé et de plus de 600 000$ pour un expert étant capable de définir et valider de nouveaux Business modèles !

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.