Entretien avec Dario Mangano, auteur du livre "The Integrated Data Hub"


Rédigé par le 18 Novembre 2013



En 2013, vous publiez un livre sur le "nouveau" Data Warehouse. Mais beaucoup d'analystes semblent dire que le Big Data, avec la vitesse et la variété des données qu'il traite, signerait la condamnation de l'entrepôt de données. Est-ce encore une bonne chose que de parler de data warehouse ? Qu'y a-t-il de nouveau à dire ?

Dario MANGANO
Vous avez raison de parler de « nouveau Data Warehouse ». En effet, je pense que le Big Data et toutes les technologies qui y sont liées, telles que Hadoop, NoSql et autres, sont une nouvelle opportunité pour le monde de l’intégration de données.

Je pense que les données issues du Big Data ne représentent qu’une source supplémentaire de données qu’il faut intégrer afin de donner aux décideurs une version unique de la vérité.

Nous parlons bien de Big Data et pas de Big Information. Selon moi, ce dont ont besoin les décideurs, plus encore aujourd’hui qu’hier, ce sont des méthodes fiables pour transformer les données en informations.

Ce que je propose dans mon livre, The Integrated Data Hub, est un ensemble de bonnes pratiques et une architecture de référence, ainsi que des conseils en terme de modélisation de données afin de mener à bien cette problématique de transformation de données, qu’elles soient Big ou pas, en informations fiables servant à la prise de décision.

Le Volume, la Variété et la Vélocité ne sont que des contraintes supplémentaires que l’architecte du Data Warehouse doit prendre en compte.

Si votre architecture de données est capable de traiter des données dont la structure peut varier, et suffisamment vite pour traiter ces nouveau flux de données, je ne pense pas que le volume soit un problème.

Les nouveaux moteurs de base de données sont tout à fait à même de traiter de grands volumes de données en temps réel. Que ce soit Oracle, IBM ou Microsoft, avec ou sans Appliance, je ne vois pas de contraintes techniques qui pourraient déjà aujourd’hui nous empêcher de traiter en temps réel ces Big Data.

N’oublions pas qu’outre le fait de pouvoir délivrer des informations intégrées et validées, le Data Warehouse est censé pouvoir délivrer des comparaisons avec des données historisées. Pour ce faire, nous aurons toujours besoin d’un endroit pour stocker ces tranches temporelles et y appliquer les règles métier qui permettent de calculer les indicateurs nécessaires à la prise de décision.

Un chapitre de mon livre est intitulé « La mort des ETL ». J’y explique que si vous faites les bons choix de modèles de données, vous pouvez facilement vous passer d’outils ETL complexes à maintenir et surtout vous pouvez facilement automatiser les traitements à l’intérieur de votre Data Warehouse.

En appliquant toutes les bonnes pratiques que je décris dans mon livre, que ce soit en terme de modélisation ou d’architecture, vous renverrez votre Data Warehouse à la place qu’il n’aurait jamais dû quitter, à savoir le Back-Office.

En résumé, le Data Warehouse n’est pas en train de mourir, mais bien en train d’évoluer et de s’adapter. Le nouveau Data Warehouse en sera une version modifiée, au sein de laquelle les jeux de données structurées et non structurées sont stockés et gérés là où cela est le plus cohérent, utilisant la technologie la mieux adaptée et surtout en adoptant une architecture étendue et bien coordonnée.

Vous étiez il y a encore quelques mois en charge de la gestion des connaissances chez Nespresso et donc du BI. Vous êtes maintenant CIO du centre des congrès de Genève. Est-ce que l'analyse de données est un bon parcours pour progresser dans le domaine des technologies de l'information ?

En fait, je n’en suis pas à ma première expérience en tant que CIO. A vrai dire j’occupe ce poste pour la 4ème fois en 23 ans de carrière.

La Business Intelligence et la gestion de la connaissance en général restent malgré tout mon domaine d’expertise, et j’ai eu l’opportunité d’exercer des postes à responsabilités dans ce domaine.

Il est vrai que chaque progression importante dans ma carrière a été précédée par un passage par le monde de la donnée et de la gestion de la connaissance.

Ces responsabilités m’ont amené à côtoyer des décideurs et à comprendre leurs besoins et ce dans différents métiers, qui vont de l’assurance aux institutions internationales en passant par la biotechnologie, l’aéronautique et la vente au détail.

Je pense donc qu’en effet, le monde de l’analyse de la données m’a permis de monter en compétences et en connaissances, de me faire une place reconnue dans le monde des décideurs et par conséquent de me faciliter l’accès à des postes à responsabilité dans le monde des technologies de l’information.

Aujourd’hui, je regarde de très près les possibilités qui sont offertes aux experts du traitement des données à accéder à des postes de direction au sein de grands groupes. Une nouvelle tendance apparaît avec la création de poste de Chief Data Officer, ce qui confirme l’importance de notre métier et me donne confiance dans notre avenir.

Vous insistez dans votre livre sur les nombreux échecs des projets d'entrepôts de données... Est-ce finalement plus rentable de ne rien analyser du tout ?

Au contraire !

Le retour sur investissement de la mise à disposition d’un environnement fiable d’analyse des données n’est plus à démontrer. La difficulté est de maximiser ce retour sur investissement et surtout de le pérenniser.

L’information disponible au sein d’une société est de plus en plus considérée comme un avantage concurrentiel pour les sociétés capables d’en tirer profit.

Encore une fois, le temps où les projets de Data Warehousing échouaient à coup sûr est révolu. Il existe de nombreuses méthodologies et architectures de références qui permettent aux architectes et aux gestionnaires de projets de mener à bien leurs travaux d’intégration de données.

Celle que je propose dans mon livre a fait ses preuves. Il n’y a plus de raisons aujourd’hui de rater votre projet de Data Warehousing !

Dario Mangano est un cadre supérieur en informatique avec plus de 23 ans d'expérience.
Il est actuellement le CIO du plus grand centre de gestions de foires, d’expositions et de congrès de Genève.
Dans son rôle précédent, il était responsable de la gestion des connaissances d'un groupe international de vente au détail, il y dirigeait les services de Business Intelligence, Enterprise Content Management et Global Data Services.
Il est certifié en modélisation de données Data Vault, fondateur du Réseau des Professionnels de la Business Intelligence en Suisse, Organisateur du Salon BI Day Switzerland, ansi que des Swiss BI Awards et inventeur du concept de Leaf Schema.

Le livre "The Integrated Data Hub" est disponible en anglais sur https://www.createspace.com/4066552 ou sur Amazon



Dans la même rubrique :