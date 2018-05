La stratégie digitale et spécifiquement l’analytics (analyse des données) se base essentiellement sur la connaissance et données métier de l’organisation. Les données ont souvent été vues par le passé comme élément permettant de prendre une décision éclairée sur un projet en cours ou une demande ponctuelle. Le contexte de la donnée a donc été construit pour cet objectif.

Aujourd’hui, les données d’une organisation peuvent être utilisées dans une autre optique que cet usage ponctuel : la constitution d’un patrimoine de donnée suffisant, de qualité et accessible, permet de tirer des conclusions opérationnelles à haute valeur ajoutée, non anticipés lors de la génération primaire de ces données.



Plus la profondeur d’historique et la granularité des données sont importantes, plus cela tient compte d’un maximum d’événements possibles (prédiction de la panne dans le cadre de la maintenance prédictive ou anticipation d’une maladie dans le cadre d’un diagnostic médical) et plus les modèles d’aide à la décision seront performants, robustes et fiables.

La profondeur, la qualité et l’accessibilité de la donnée sont donc des avantages compétitifs déterminants.

Certaines organisations envisagent de commencer à zéro car elles ont des difficultés à trouver les ressources suffisantes pour retravailler sur l’historique des données et en assurer sa qualité, sa pertinence et sa cohérence. Cette stratégie est certes pragmatique mais réduit l’avantage que l’organisation a développé grâce à ses connaissances et son patrimoine de données. Les méthodes de Machine Learning sont une opportunité à considérer fortement pour accélérer la mise en cohérence des données et leur qualité par un traitement semi-automatique ce qui permet de diminuer la contribution des experts. En effet, les solutions semi-automatiques sont privilégiées car nous avons besoin de maintenir une validation par un expert pour aider l’apprentissage du modèle. Une fois le modèle validé il permet de détecter les évènements similaires et reproduire la validation de l’expert automatiquement cependant quand le modèle rencontre un évènement nouveau, il lui faudra une nouvelle validation d’expert pour éviter les mauvaises affectations/corrections. Il s’agit là d’une capacité analytics stratégique pour une organisation mais qui reste malheureusement peu connue et utilisée. Plus l’exploitation de ces données historiques est poussée, plus la détection des incohérences sera fréquente et donc plus ces incohérences seront corrigées.



Au-delà de la disponibilité des données, il faut s’assurer que les technologies choisies permettent d’atteindre les objectifs fixés par le projet.

Une technologie adéquate doit autoriser :

 L’accessibilité facile aux données de tout autre système utilisé : une organisation utilise souvent des solutions différentes (open source, plusieurs propriétaires, hybrides..) et il est donc essentiel que la technologie qui permet de centraliser les données puisse être agnostique et connectable avec tout type de source

 La performance de calcul nécessaire : Plus l’usage des analytics va augmenter, plus les besoins en capacité et puissance de calcul vont s’accroître avec pour conséquence directe, un temps de réponse fortement challengé. La technologie doit donc proposer des qualités intrinsèques de scalabilité linéaire de la performance à adapter avec l’usage.

 Une industrialisation du projet efficace au moindre coût

 Service Level Agreement (SLA) élevé et robuste capable de répondre aux exigences des métiers, absorber les variations et demandes adhoc imposées par le changement de contexte et ne pas risquer d’impacter l’activité (arrêt ou dégradation du fonctionnement).

 L’accompagnement par une méthodologie d’implémentation agile, fédératrice et incrémentale