Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Teradata vise le Pétaoctet

La course à la taille des entrepôts de données se poursuit


Rédigé par le 28 Avril 2005

Plus de sources de données, une plus grande fréquence de mise à jour, tous les ingrédients sont réunis pour que les grandes entreprises poursuivent la croissance exponentielle de leurs entrepôts de données d’entreprise. Teradata compte bien les y aider, avec son offre intégrée de serveurs, base de données et applications analytiques, relativement unique sur le marché. Mais en tentant d’embrasser trop largement, Teradata noue de très nombreux partenariats, qui font parfois perdre un peu de crédibilité au message de fond.



Teradata vise le Pétaoctet
Faudra-t-il, comme le suggère mon collègue belge de Datanews, que Teradata change prochainement de nom pour s’appeler Petadata, sous peine de paraître ringarde dans quelques années ? En tous cas, le concept de Téraoctet semble bien dépassé dans l’esprit même du fournisseur de solutions décisionnelles intégrées. Laissons nous emporter par quelques chiffres… D’après l’université américaine de Berkeley, notre monde stockera 57 millions de téraoctets de données en 2005, soit 24 millions de téraoctets de plus que l’an dernier. Durant les deux prochaines années, l’humanité créera plus de données numériques qu’elle ne l’a fait durant toutes ces 40 000 dernières années ! Le volume total de données créées sera multiplié par quatre durant ces deux prochaines années. Une aubaine pour les fournisseurs de serveurs, de disques et… de bases de données.

L’économie numérique pousse à la croissance des volumes de données

Quelles sont les principales raisons à cette croissance exponentielle de la création de données ? Tout d’abord bien entendu la numérisation progressive d’informations jusqu’alors stockées sur d’autres formats (papier en particulier). Mais cela ne représente en réalité qu’une faible part de cette inflation. L’essentiel de la croissance est tiré par la création de données numériques jusqu’à présent perdues, et qui deviennent peu à peu essentielles pour les entreprises et les organisations. Le meilleur exemple est sans doute le fameux « ticket de caisse ». Pendant des dizaines d’années, le ticket de caisse n’était qu’une simple addition. Rappelez vous du boucher qui se saisissant du crayon coincé sur son oreille, notait le prix de votre escalope de veau directement sur le papier d’emballage.
Aujourd’hui ce même ticket de caisse est devenu le nerf de la guerre des distributeurs. Il sert à comprendre qui consomme quoi, quand, et où. Il sert de support aux prévisions de vente, donc d’achats, et de négociation auprès des fournisseurs. Il sert de support promotionnel, de fidélisation, et d’outil de segmentation pour les campagnes de marketing…

Les distributeurs ont en effet compris que la connaissance intime du client, ignoré du monde de la distribution pendant des décennies, leur permettrait d’envisager une croissance non négligeable de leurs marges, et un meilleur retour de leurs investissements promotionnels et publicitaires. Et ce n’est qu’un début ! La prochaine révolution dans ce domaine s’appelle RFID. Une petite étiquette électronique susceptible de stocker encore plus d’informations sur la vie du produit et de les transmettre lors du passage à proximité d’un lecteur adéquat. Les idées d’applications ne sont encore qu’embryonnaires, mais on cherchera bientôt certainement à savoir non pas quand vous avez acheté un produit, mais quand, où et comment vous l’avez consommé. Déjà 35 % des distributeurs européens (interrogés récemment dans une étude réalisée par Teradata) concèdent avoir un projet en matière de RFID. Ces nouvelles technologies seront bien entendu fortement créatrices de données et consommatrices d’outils d’analyse.

Plus de temps réel, donc plus de données

L’autre tendance directement génératrice de gigaoctets de données est celle de la fréquence de rafraîchissement des données. Teradata préconise en effet le passage à l’entreprise en temps réel. Sachant que toute donnée créée doit être conservée, car elle est susceptible de servir plus tard à l’analyse, on comprend que l’entreprise en temps réel soit une véritable manne en terme de serveurs, de systèmes de stockage et de bases de données. Teradata, dont la force est dans la gestion de grandes bases de données complexes, a tout intérêt à promouvoir ce concept. Tous les secteurs d’activité ne sont certes pas concernés, mais l’exemple de Walmart, numéro un mondial de la distribution, est intéressant… à l’échelle de l’Amérique du Nord.
Au quotidien tout d’abord, les marketeurs de Walmart peuvent analyser chaque matin les premières données dès l’ouverture des magasins de la côte Est. Le décalage horaire de quelques heures avec la côte Ouest, permet de prendre des décisions en temps réel, et d’en faire immédiatement bénéficier les magasins Californiens, dès leur ouverture.
Autre exemple heureusement moins fréquent, mais tout aussi important du point de vue économique, le cyclone Frances de l’an dernier. Au fur et à mesure qu’il se déplaçait, touchant d’abord la pointe de la Floride, puis remontant le long de la côte Est, les analystes de Walmart ont pu détecter les achats de précaution réalisés par les consommateurs en prévision de leur retraite forcée cloîtrés dans leur maison. Au premier rang de leurs achats… la bière… ce que les marketeurs savaient peut-être déjà. Mais plus étonnant, au second rang, les tartelettes aux fraises ! Au fur et à mesure de l’avancée du cyclone, Walmart a pu sur-approvisionner ses magasins en tartelettes, et non seulement éviter la rupture de stock, mais répondre aux attentes de ses clients et générer de la marge supplémentaire.
Inversement, si votre système d’information est basé sur la seule remontée d’informations quotidiennes, sans qu’une accélération ne soit possible, inutile d’envisager un data warehouse en temps réel, il ne servirait à rien.
Avec ironie, Teradata a d’ailleurs rappelé les mots magiques qui définissent cette évolution du décisionnel vers le temps réel : on parle alors de « Active Data Warehousing », « Event-driven enterprise » ou encore de « Zero Latency Enterprise ».
Que vous considériez cette évolution comme un progrès ou comme une perspective de stress supplémentaire autant qu’inutile, les exemples sont nombreux : stockage en temps réel des conversations d’un centre d’appels en voix sur IP rattachées au contact client, interventions médicales préventives automatiques liées à des capteurs renvoyant de l’information sur votre santé, services aux administrés disponibles en 24/7, suivi d’une comptabilité quotidienne et édition d’un compte de résultat de la journée…

Les architectures et les applications de demain

Pour Stephen Brobst, directeur technique de Teradata, de nouvelles sources de données vont également apparaître : des données externes de plus en plus nombreuses, l’implication des décideurs opérationnels qui seront sollicités pour faire remonter de l’information…
Cet élargissement des sources et de la fréquence des données justifie selon Teradata de passer du modèle habituel des data marts (petits entrepôts de données spécialisés dans un domaine) à celui de l’entrepôt de données d’entreprise (EDW – Enterprise Data Warehouse), qui regroupe l’ensemble des métiers et permet la multiplication des croisements de données.

Mais comment tirer pleinement parti de ces entrepôts de données d’entreprise aux dimensions galopantes ? Teradata estime en effet qu’un de ses clients, sans doute Walmart, dépassera dans le courant de l’année le Pétaoctet de données, et que l’ensemble des bases de données de ses clients devrait dépasser les 4 Pétaoctets fin 2005. Il faut pour les analyser, des applications dédiées.
Teradata, fidèle à sa logique initiale de fournisseur d’une solution complète, propose un ensemble d’applications, opérationnelles et décisionnelles, verticalisées par secteur d’activité (transport, distribution, banque…). Mais Teradata ne peut décemment pas affirmer une compétence universelle, et doit s’appuyer sur des partenaires éditeurs pour compléter son offre. Certains partenariats tels que Fair Isaac ou Kxen sont parfaitement logiques, et apportent leur valeur ajoutée aux clients utilisateurs des solutions combinées. D’autres accords, comme celui passé avec Hyperion, améliorent la couverture fonctionnelle de Teradata dans un domaine où il est peu présent, l’analyse de la performance financière des entreprises.
D’autres partenariats enfin semble purement opportunistes, et troublent même la lisibilité du message global de Teradata. C’est en particulier le cas de la communication commune avec Siebel ou encore avec SAP. Siebel souhaite en effet se développer dans le domaine des applications analytiques, et semble bien plus en concurrence avec Teradata que réellement partenaire. Quant à SAP, dont la direction générale a largement communiqué sur l’intérêt stratégique que représente le décisionnel et donc la solution maison SAP BW, le partenariat avec Teradata semble là aussi anachronique.
Le discours officieux est d’ailleurs clair chez Teradata : l’éditeur souhaite se développer dans le monde industriel, et a annoncé récemment en France une offre dédiée à l’industrie. Or SAP est omniprésent chez les grands comptes industriels. Un mauvais partenariat serait donc préférable à une vraie concurrence. Quant à l’accord avec Siebel, il tente de préserver la position de chacun des deux éditeurs chez ses clients, sans apporter de réelle valeur ajoutée stratégique.

En conclusion

Cette stratégie de la course à la puissance semble différemment appréciée en interne chez l’éditeur. Certains se plaignent en effet qu’elle ne conforte l’image de l’éditeur d’une solution chère et haut de gamme, réservée aux très grands comptes. Un prospect français présent à Teradata Universe, la conférence européenne qui s’est déroulée cette semaine en Autriche, cherchait d’ailleurs désespéramment à rencontrer le plus petit client de Teradata, se sentant plus proche de lui que des Pétaoctets de Walmart.
Au-delà de la taille, c’est en effet également la complexité d’un modèle de données, propre à une entreprise ou un secteur d’activité. La multiplication des dimensions, des croisements entre les sources de données, nécessitent une puissance de calcul et de stockage que l’on ne retrouve que chez les grands constructeurs-éditeurs : Teradata, IBM, ou encore le challenger, Netezza. Même si le « ticket d’entrée » pour un constructeur est très élevé, les positions acquises ne sont jamais définitives. Et si Teradata apparaît clairement aujourd’hui comme le fournisseur le plus complet, qui affiche le plus de références dans ce domaine des grands entrepôts de données d’entreprise, il doit continuer à innover pour maintenant sa présence, et son chiffre d’affaires récurrent, auprès de ses grands clients.




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.