Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


Premières conclusions de l’Etude Métier Data Scientist : une hybridation, pas une révolution


Rédigé par Thierry Valaud, Socio Logiciels le 16 Octobre 2013

Suite à ma précédente contribution Le data scientist c'est du naming, dans laquelle j’expliquais pourquoi le métier de Data Scientist était pour moi plus qu’un nouveau métier, une évolution naturelle du métier de Data Miner ; j’ai décidé d’interroger des experts reconnus du marché par le biais d’un questionnaire ouvert. Objectif : aller au-delà du mythe et recueillir la vision pragmatique de spécialistes reconnus de la Data. Ces experts ont pour point commun d’avoir déjà utilisé le vocable « Data Scientist » dans leurs propos lors de rencontres ou dans la presse spécialisée.



Thierry Vallaud, Socio Logiciels
Thierry Vallaud, Socio Logiciels
Avant l‘analyse quantitative qui sera dévoilée prochainement, les premiers enseignements dégagés confirment ma précédente prise de position.

Définition du métier Data Scientist : une hybridation entre des métiers déjà connus
La plupart des répondants citent le métier de Data Miner en tant que dénomination précédente du métier de Data Scientist. Les termes de « Statisticien », « Chargé d’études statistiques » ou d’ « Analyste Statisticien » apparaissent également. L’un d’eux précise que cela diffère en fonction du pays. Aux Etats Unis, il s’agirait plutôt « d’informaticiens intelligents au solide bagage scientifique » alors qu’en France les profils seraient plutôt des Statisticiens sortis de formations scientifiques de type Grandes Ecoles.

Des compétences multiples aux socles de connaissance déjà existants
Le socle du Data Scientist est bien pour tous les répondants les statistiques. La notion de compétences multiples est très présente dans les réponses des experts et plusieurs avis concordent sur le fait que le Data Scientist doit disposer d’une triple compétence opérationnelle, à savoir :
• la maitrise des techniques du Data Mining et des Statistiques,
• une appétence aux technologies et aux outils informatiques des bases de données
• un savoir-faire métier dans le domaine d’application des données étudiées (le Marketing est principalement cité).
Un répondant s’interroge sur la notion du Data Scientist omniscient, qui cumulerait à lui seul les trois compétences et suggère que la clé du succès résidera certainement davantage dans le fait de faire collaborer managers, statisticiens et informaticiens.

Des missions précédemment dévolues dans le passé aux data miners
Au quotidien, la répartition des tâches incombant à la fonction de Data Scientist est très variable selon les secteurs, les enjeux, et le niveau d’expérience. Néanmoins, les grandes étapes qui structurent un projet sont citées (toutes ou en partie) par la plupart des répondants :
• Comprendre la problématique métier, les enjeux et les objectifs de l’analyse. Traduire un problème « business » en problème mathématiques/statistiques ;
• Obtenir des données adéquates : trouver les sources de données pertinentes, faire des recommandations sur les bases de données à consolider, modifier, rapatrier, externaliser, internaliser, concevoir des datamarts, voire des entrepôts de données (data warehouses) ;
• Evaluer la qualité et la richesse des données, les analyser et en restituer les résultats. Les intégrer dans le système d’information cible.
Certains répondants font remarquer que la plupart de ces missions étaient déjà dévolues au data miners.

Pas encore de formations dédiées
Les formations préconisées par les répondants sont principalement les écoles d’ingénieurs spécialisées en statistique (de type ENSAI, ENSAE, Télécom), les grandes écoles plus généralistes, de type Centrale, Polytechnique ou la formation continue de la CNAM. Dans tous les cas, le cursus doit associer les statistiques et le Data Mining à l’informatique. Certains confirment que le monde universitaire semble pour l’instant peu adapté (les outils récents n’y sont pas enseignés) et le déconseillent. D’autres préconisent même une formation plus pratique que théorique avec l’autoformation ou un apprentissage du Data Mining « sur le terrain ».

Un avenir prometteur, à condition de miser sur la complémentarité des métiers
Les retours des répondants quant à l’évolution de la fonction de Data Scientist sont plutôt positifs et porteurs d’espoirs. Un expert précise même que « Google annonce que c'est LE métier n°1 d'avenir ». En effet, la plupart des interrogés pensent que la fonction sera « de plus en plus reconnue », « de plus en plus demandée ». Les vrais Data Scientists seront d’ailleurs appelés à exercer des fonctions stratégiques au sein des entreprises. La demande étant croissante, l'écart entre demande et offre va continuer de se creuser et certaines fonctions vont nécessairement évoluer vers la fonction de Data Scientist. En pratique, les Data Scientists vont devoir être plus polyvalents dans les technologies et les outils maitrisés. Ils vont également devoir faire preuve de plus de pédagogie et accroitre encore leur maîtrise du Data Mining. Les volumes de données vont bien entendu augmenter, les types de données vont être de plus en plus hétérogènes, les domaines d’application vont s’élargir, et par conséquent le panel des méthodologies à maîtriser augmentera aussi proportionnellement.
Un spécialiste suggère que les fonctions de Data Management, aujourd’hui assumées par le Data Scientist, devraient pouvoir être confiées à des Data Managers encadrés par un Data Scientist afin que ce dernier consacre moins de temps à la préparation des données et davantage à l’analyse et l’interprétation des résultats.

En réalité, il n’y aurait pas finalement pour certains répondants « un Data Scientist » mais des Data scientists avec des compétences différentes qui devraient s’associer ensemble.

Affaire à suivre donc !




Commentaires
Du plus récent au plus ancien | Du plus ancien au plus récent

11.Posté par Thierry Vallaud le 01/11/2013 11:13
@Abded
Votre cours à l'air très intéressant mais je ne pourrai y assister, des documents sont t'ils en ligne
Récemment j'ai lu cela sur la data visualisation sujet qui n'est pas m'a préoccupation principale mais qui m'intéresse néanmoins
http://www.amazon.fr/Convaincre-avec-graphiques-efficaces-powerpoint/dp/2212553994/ref=pd_rhf_sc_s_cp_1_NTZ2?ie=UTF8&refRID=1TYFAFSHS98TC16N8VH5
http://www.amazon.fr/Visual-complexity-Manuel-Lima/dp/1568989369/ref=sr_1_22?ie=UTF8&qid=1383300312&sr=8-22&keywords=data+representation#_
On pourrait imaginer que la data visualisation soit un des métiers spécialisés de la data science peut être plus proche des "arts graphiques" de la "communication visuelle" et de la "sémiologie" que de l'informatique ou de la statistique ?

12.Posté par Thomas le 05/12/2014 15:27
"Pas encore de formations dédiées ".
C'est vrai en ce qui concerne les formations traditionnelles. Avec internet, de la motivation et une connaissance de l'aanglais on peut se former tout seul maintenant. Il y a une foule de ressource ici ( https://skim.it/u/ThomasV/data-science-learning-path )

1 2
Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.