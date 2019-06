Mais ce qui distingue aujourd’hui plus fondamentalement la data science des statistiques, c'est la différence dans l’approche de la valorisation des données : l’approche générative ou l’approche prédictive. La première cherche à établir la structure d’un modèle adapté aux données, puis à tirer des conclusions sur le mécanisme générateur de donnée, alors que la seconde donne la priorité à la prédiction, ne s’intéressant pas au mécanisme sous-jacent à la production des données et préférant se concentrer la précision de la prédiction des algorithmes. C’est aujourd’hui bien la modélisation prédictive qui est l’un des moteurs essentiels de l’intelligence artificielle, permettant l’utilisation des données pour aider l’ordinateur à l’automatisation, et l’une des innovations les plus marquantes de ces dernières décennies ! Les avancées qu’a connu le « Machine Learning », sur lequel est basé l’essentiel des systèmes d’IA modernes, vers davantage de prédiction constituent sans aucun doute l’un des principaux fossés existants aujourd’hui entre les statistiques traditionnelles et la data science.



Elle a donc aujourd’hui de solides raisons d’exister, ne se résumant pas à la seule combinaison des statistiques et de l’informatique. Et pour cause, pour résoudre des problèmes concrets, un data scientist devra s’acquitter des tâches qui dépassent sa formation traditionnelle, faisant notamment appel aux succès des techniques du deep learning pour tester plus largement et répondre plus spécifiquement.