Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Une réponse spécialisée aux défis du décisionnel


Rédigé par par Isabelle Genestoux, Directrice Marketing, Sybase France le 5 Octobre 2009

Face à l’explosion des volumes et des utilisations de la Business Intelligence, les bases de données en colonnes, conçues spécifiquement pour les usages analytiques, apportent performance, souplesse et maîtrise des coûts.



Isabelle Genestoux, Directrice Marketing, Sybase France
Isabelle Genestoux, Directrice Marketing, Sybase France
Parmi toutes les applications d’entreprise, le décisionnel est peut-être celle qui a connu l’essor le plus fulgurant au cours des dernières années. À l’origine cantonné à des tâches de reporting, essentiellement financier, son usage s’est peu à peu étendu à tous les métiers et tous les niveaux de l’organisation. On le retrouve du marketing aux ressources humaines, de la logistique à la gestion client. Il est employé aussi bien par les managers, pour qui il constitue une aide précieuse au pilotage de leur activité et de leurs équipes, que par les opérationnels, qui peuvent agir en s’appuyant sur des éléments tangibles. Enfin, il n’est plus seulement utilisé a posteriori, pour obtenir une vision synthétique de la situation, mais aussi de façon prédictive, avec des projections sur la base d’éléments historiques. La conséquence de cet engouement pour la Business Intelligence est un accroissement considérable des volumes et de la nature des données traitées, ainsi que de la quantité et de la sophistication des requêtes. De plus en plus nombreux, les utilisateurs réclament toujours plus de possibilités et de souplesse, tout en tolérant de moins en moins de ne pas obtenir leur réponse instantanément…

Dans ce contexte, les bases de données sont soumises à des sollicitations considérables et sans cesse croissantes. Pendant longtemps, les bases de données traditionnelles, multiusages, étaient suffisantes pour répondre aux besoins du décisionnel. Toutefois, face à l’accroissement des volumes et à la multiplication des demandes des utilisateurs, les administrateurs ont dû mettre au point des stratégies de contournement pour maintenir des niveaux de performance acceptables. Le premier réflexe a été – et demeure – d’ajouter de la puissance machine au gré des besoins, solution efficace mais difficile à tenir économiquement. On a également entrepris de créer des datamarts spécialisés, ou des univers métier, pour restreindre le nombre d’enregistrements à examiner lors d’une requête et ainsi alléger le processus. Mais cette approche a un double défaut : d’une part elle nécessite des développements et de la maintenance, et donc des coûts et des délais supplémentaires, et d’autre part, elle sépare les données en silos hermétiques, ce qui prive les utilisateurs de possibilités de requêtes libres et/ou transverses qui n’auraient pas été prévues.

Ces approches trouvent aujourd’hui leurs limites car l’explosion actuelle des besoins analytiques les rend de plus en plus lourdes et de moins en moins efficientes. Le cœur du problème est en réalité technique : les bases de données généralistes, utilisées aussi bien pour les applications transactionnelles que décisionnelles, sont organisées en lignes. Les entrées sont rangées les unes sous les autres, ce qui signifie que chaque requête nécessite de parcourir l’ensemble des champs. Ainsi, l’accroissement des volumes et la complexité des demandes conjuguent leurs effets : les opérations sont démultipliées et le système voit ses performances se dégrader, parfois jusqu’à la rupture.

La solution réside dans l’adoption d’une base de données en colonnes, spécialisée pour un usage décisionnel. La structure en colonne permet de ne balayer que les champs utiles et donc de diminuer drastiquement les opérations pour des performances retrouvées. La course à la puissance devient inutile, tout comme il n’est plus nécessaire de segmenter la base de données en datamarts : dans une base en colonne, toutes les données peuvent être indexées et tous les croisements redeviennent possibles, ouvrant ainsi de nouvelles perspectives d’exploitation de l’information. Les coûts matériels et de maintenance sont considérablement réduits, et les utilisateurs bénéficient d’une liberté plus grande et de meilleurs temps de réponse. Les bases de données en colonne ne sont pourtant pas nouvelles : elles existent depuis plus d’une dizaine d’années et elles ont fait la preuve de leurs avantages et de leur robustesse dans d’innombrables entreprises de tous secteurs. Mais si elles pouvaient être considérées jusqu’à présent comme une simple option technique, leur utilisation apparaît aujourd’hui incontournable pour qui veut optimiser l’efficacité et le coût de possession de son système décisionnel.





Commentaires

1.Posté par Nabil le 07/10/2009 11:50
Bonjour,
Outre des gains de performance, un autre avantage de la base de donnée vectorielle est me semble t-il la suppression des index qui de mon point de vue sont inutiles dans ce type d'organisation de données. Adieu également aux produits cartésiens du relationnel...
Il n'y a aucun doute sur le gain de performance en mode selection de données mais quid des update ?
Cdt,

2.Posté par Bernard Fitoussi le 21/10/2009 15:24
Bonjour,
Rendons à César ce qui appartient à César. Oui Sybase est depuis longtemps le champion des SGBD en colonnes, avec de belles références, mais, depuis Galilée, il n'est toujours bon d'avoir raison trop tôt.
Le créneau vertical est aujourd'hui investi par de nouveaux entrants, avec chacun une touche personnelle: l'opensource Infobright (moteur de MySQL) et sa remarquable technologie de "Knowledge grid" (conçue en Europe s'il vous plaît!), Vertica issu d'un projet universitaire et seul massivement parallèle, avec un mode de stockage par groupe de colonnes (et non de colonnes uniques)...
Plus ceux qui ne vont pas tarder à arriver en Europe: les Paraccel, Kickfire, Calpont ...
Plus ceux qui sont en gestation, tels Vectorwise d'Ingres
Ouf!
Aujourd'hui, en effet, ce serait une erreur que de ne pas considérer les bases verticales dans les projets BI.
Cdt
Bernard Fitoussi

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.