Decideo

Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...


 
     

Détectez un vrai d’un faux Data Scientist !


8 Janvier 2016

Dans un article publié sur Data Science Central, Laetitia Van Cauwenberge propose une liste de dix questions à poser à un soi-disant Data Scientist pour évaluer sa compétence.
Rappelez-vous, il y a quelques mois, est apparu sur LinkedIn une image amusante qui proposait de devenir Data Scientist en trois minutes !



La recette était à peu près : Ouvrir LinkedIn, Vous connecter à votre profil, Modifier la zone “Your professional headline” et indiquer “Data Scientist”, puis, très important, cliquer sur “save”. C’est un miracle, ça fonctionne ! Je l’ai fait, je suis devenu Data Scientist !

Plus sérieusement, face au nombre croissant de candidats au métier le plus sexy du XXIème siècle, beaucoup tentent leur chance et espèrent booster leur carrière, leur salaire, ou trouver un nouvel employeur par une simple évolution de leur profil.

Si vous envisagez de recruter un data scientist, vous devez donc connaître les questions à poser pour séparer le bon grain de l’ivraie.

Voici les questions suggérées par Laetitia, elles-mêmes suggérées par un data scientist de son entreprise :
What is the life cycle of a data science project?
How do you measure yield (over base line) resulting from a new or refined algorithm or architecture?
What is cross-validation? How to do it right?
Is it better to design robust or accurate algorithms?
Have you written production code? Prototyped an algorithm? Created a proof of concept?
What is the biggest data set you have worked with, in terms of training set size, and in terms of having your algorithm implemented in production mode to process billions of transactions per day / month / year?
Name a few famous API's (for instance Google search). How would you create one?
How to efficiently scrape web data, or collect tons of tweets?
How to optimize algorithms (parallel processing and/or faster algorithm: provide examples for both)
Examples of NoSQL architecture?
How do you clean data?
How do you define / select metrics? Have you designed and used compound metrics?
Examples of bad and good visualizations?
Have you been involved - as an adviser or architect - in the design of dashboard or alarm systems?
How frequently an algorithm must be updated? What about lookup tables in real-time systems?
Provide examples of machine-to-machine communication.
Provide examples where you automated a repetitive analytical task.
How do you assess the statistical significance of an insight?

Qu’en pensez-vous ? Et si vous avez indiqué “Data Scientist” sur votre profil LinkedIn, êtes-vous capable de répondre à toutes ?

Lu 5419 fois
Philippe NIEUWBOURG
Philippe Nieuwbourg est expert précurseur en intelligence d’affaires. Il a créé et dirige depuis le... En savoir plus sur cet auteur


1.Posté par Vallaud Thierry le 12/01/2016 02:09
Je sais répondre à toutes les questions qui méritent pour certaine de la nuance.....voir beaucoup de nuance.
Par ailleurs je pense que la dernière génération (et les générations à venir) des outils de modeling comme Modeler ou Azure ML vont généré des clusters Hadoop et du code comme Spark via des interfaces objet de plus en plus conviviale remettant en cause l'importance de coder dans le dure. Python, le PMML ou R seront alors le moyen d'ajouter des add on manquant à ces outils en trouvant la bonne librairie.

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.

 





France
Espanol



Google+

Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées sur ce site, faite sans l'autorisation de l'éditeur est illicite et constitue une contrefaçon.