Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


Teradata établit une nouvelle référence en matière de bases de données en colonnes avec Teradata Columnar


Rédigé par Communiqué de Teradata le 30 Septembre 2011

La base de données hybride combinant lignes et colonnes conforte sa position de leader dans le domaine des entrepôts de données et du reporting analytique



Teradata (NYSE : TDC), spécialiste mondial en matière de solutions analytiques, annonce le lancement de Teradata Columnar. Doté d'une technologie de base de données révolutionnaire, ce produit intègre les tables en lignes et en colonnes pour offrir une souplesse, des performances et des capacités de compression hors pair. Grâce à Teradata Columnar, la base de données Teradata tourne plus rapidement et offre des niveaux de compression plus élevés que ses concurrentes. Son architecture avancée procure l'environnement prêt à l'emploi le plus complet aux entreprises qui doivent réaliser des analyses à partir de données de plus en plus volumineuses.

Contrairement aux systèmes de gestion de bases de données relationnelles qui stockent uniquement les données par ligne, une base de données à colonnes stocke les données par colonne. Utilisée séparément, chaque méthode apporte des avantages spécifiques selon l'application et le type de données. Néanmoins, la nouvelle fonctionnalité orientée colonnes de Teradata permet de combiner le stockage physique en lignes et en colonnes lorsqu'une application le demande. Grâce à Teradata, les applications accèdent à la fois aux données structurées par ligne et par colonne, pour une souplesse et des performances inégalées.


« Cette souplesse constitue un atout pour les entreprises qui se débattent avec d'énormes jeux de données, une population d'utilisateurs en augmentation et des contrats de niveau de service basés sur les performances. Avec Teradata Columnar, nos clients peuvent créer en un temps record des analyses plus précises, destinées à un plus grand nombre de personnes », explique Scott Gnau, Président de Teradata Labs, Teradata Corporation. « La souplesse de Teradata Columnar permet d'utiliser les applications d'analyse en combinaison avec la structure de table appropriée, avec à la clé des temps de réponse réduits à partir d'un entrepôt de données unique. En outre, le produit sélectionne automatiquement la meilleure méthode de compression, puis l'adapte de façon dynamique au fur et à mesure de l'évolution des données. »

Avantages de Teradata Columnar selon le secteur d'activité

Teradata Columnar permet aux utilisateurs de l'entreprise de prendre la décision la plus avisée en fonction des nouvelles analyses afin de créer un avantage concurrentiel durable, quel que soit le secteur d'activité.

Télécommunications : lorsqu'un client qui contacte un technicien du service client par téléphone est mis en attente, le technicien doit rechercher les enregistrements détaillés des appels (CDR) du client, qui peuvent compter plus d'une centaine de colonnes. Or, dans la plupart des cas, quelques colonnes seulement permettent d'apporter des réponses aux questions du client. Teradata Columnar peut réduire de 90 % le volume des données nécessaires en vue de la requête. La limitation des opérations d'entrée et sortie entraîne une réduction conséquente du délai de réponse au client.

Services financiers : lorsqu'un responsable du marketing bancaire personnalise les contacts de vente à l'aide de données CRM, il utilise tout au plus 10 attributs relatifs au client, parmi lesquels le numéro client, les caractéristiques démographiques, le dernier produit acheté et le dernier canal utilisé. Néanmoins, le système CRM collecte des centaines d'attributs client. Avec la méthode orientée colonnes, la quantité de données lue dans la fiche client est réduite de 90 % car seuls les 10 attributs nécessaires sont exploités (et non les centaines d'attributs de la ligne complète). Cette fonctionnalité haute-performance propose un temps de réponse aux requêtes de quelques millisecondes pour le marché entrant.

Distribution : un acheteur commande des produits pour une chaîne de magasins. Il n'est intéressé que par un nombre limité d'articles, portant des numéros de référence définis. Cependant, les systèmes de gestion de la chaîne de demande du commerce de détail stockent un large éventail d'attributs pour chaque article, dont la date, les lieux des magasins et la référence afin de se conformer à un ensemble d'obligations de reporting. L'utilisateur de l'entreprise souhaite uniquement obtenir les données pertinentes pour sa question ; il n'a pas besoin de toutes les mesures. Avec la méthode orientée colonnes, seules les données mentionnées dans la question de l'acheteur sont lues, ce qui induit une amélioration des performances et une diminution des coûts de traitement par rapport à la méthode consistant à lire toutes les colonnes de la table.


« Premier produit de l'industrie à concrétiser le stockage en colonnes hybride, Teradata Columnar représente une avancée considérable. Jusqu'ici, les produits orientés colonnes fonctionnaient exclusivement avec des colonnes avec toutes les limitations qui leur incombaient ou existaient sous forme de compléments peu performants. Teradata Columnar n'est pas une technologie complémentaire mais un produit intégré au meilleur logiciel de base de données », ajoute Scott Gnau. « Extrêmement flexible et conviviale, son intégration avec le stockage en lignes permet aux entreprises de tirer le meilleur parti de leurs données. »


« À notre sens, la fonctionnalité de stockage des données en colonnes présente un caractère évolutif » indique Donald Feinberg, Vice-président et analyste réputé chez Gartner Inc. « Il s'agit d'une technologie clé qui délivre une forte valeur ajoutée en aidant les entreprises à adapter leur infrastructure IT à l'évolution des demandes de renseignements fiables et rapides pour mener leur activité. Par ailleurs, cette technologie aura d'importantes répercussions sur la conception des systèmes et permettra de réaliser des économies considérables sur le plan de la consommation d'énergie. »

Teradata Columnar : concrétisation d'une promesse

Teradata Columnar élimine les goulets d'étranglement de performances en stockant les données dans des colonnes plutôt que dans des lignes. Seules les données nécessaires pour une requête dans les colonnes sont transférées vers la mémoire pour y être traitées, ce qui entraîne une réduction considérable des entrées/sorties laborieuses inhérentes à une méthode orientée lignes, qui lirait les données de toutes les colonnes.
Les clients peuvent adopter Teradata Columnar en toute confiance, sachant que son design élégant hybride comprend les fonctionnalités qui supportent les applications critiques de mission qui elles-mêmes dépendent de grands volumes de données dans des tableaux en colonnes. Contrairement aux offres de la concurrence, Teradata Columnar supporte les applications avec des fonctionnalités avancées de gestion de la charge, la haute disponibilité, riche langage de requête structuré (SQL), en base de données Google Analytics, un optimiseur de l'industrie de pointe et une évolutivité inégalées.


« Avec Teradata Columnar, Teradata associe les avantages de ses nouvelles fonctions hybrides de lignes et de colonnes en terme de performance avec la haute disponibilité de Teradata, la prise en charge du langage Rich SQL, l'optimisation et la gestion de la charge » déclare David Menninger, Vice-président et Directeur de recherche chez Ventana Research. « Les clients de Teradata peuvent désormais bénéficier des fonctions de base de données en colonnes intégrées à la plate-forme Teradata. »

Compression automatique et efficace

Outre les avantages qu'offre le stockage des données en colonnes du point de vue des performances, Teradata Columnar débloque l'engorgement en E/S grâce à la compression. La compression réduit les opérations d'E/S requises pour lire les données en mémoire car les données nécessaires pour répondre à une requête sont comprimées en une fraction de leur taille. Qui plus est, Teradata Columnar automatise l'administration de la compression, libérant l'administrateur de base de données des tâches d'analyse à réaliser pour effectuer un choix parmi plusieurs alternatives de compression complexes. La base de données utilise automatiquement les méthodes de compression les mieux adaptées à la situation.

En outre, Teradata Columnar ajuste les méthodes de compression de façon dynamique pour un stockage optimal au fur et à mesure de l'évolution des données, facilitant la tâche de l'administrateur de base de données, confronté à l'évolution et à l'augmentation constantes des besoins en compression du stockage. La stratégie spécifique de Teradata en termes d'architecture consiste à créer des conteneurs dans chaque colonne pour optimiser la compression des données. Les valeurs des données d'un conteneur dans une colonne peuvent, par exemple, bénéficier d'un type d'algorithme de compression donné, tandis que les valeurs d'un autre conteneur chargé six mois plus tard bénéficieront d'un autre algorithme. En sélectionnant les algorithmes pertinents pour chaque conteneur, Teradata Columnar maximise la compression possible au sein d'une colonne, améliorant de façon sensible les performances d'E/S et du système par rapport à un déploiement moins sophistiqué.

Teradata propose automatiquement les six types de compression suivants : RLE, Dictionary, Trim, Delta on mean, Null et UTF8 en fonction de la démographie de la colonne. Un magasin de boissons qui vend une boisson spécial vacances tout au long du mois de décembre peut, par exemple, bénéficier d'une compression RLE en complément d'une compression du type Dictionary. Au cours du mois de mai, les ventes de boissons sont plus aléatoires et irrégulières, ce qui réduit les répétitions de la compression RLE. Par conséquent, cette méthode de compression-là est automatiquement ajoutée aux données de compression du mois de décembre, mais non du mois de mai.

La fonctionnalité orientée colonnes sera disponible en décembre, avec Teradata Database 14. La base de données enrichie représente le moteur d'analyse haute-performance sous-jacent de la Teradata Purpose-Built Platform. Tous les produits Teradata Purpose-Built Platform peuvent bénéficier de Teradata Columnar pour des charges de travail d'analyse spécifiques. Teradata Database 14 est également disponible sous forme de logiciel seulement dans Data Mart Edition et dans Teradata Express pour la solution en mode Cloud Computing.




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store