Retour sur le premier Apéro Big Data de Juillet 2013

La première présentation par Romain Chaumais d’Ysance expose les enjeux du big data pour la BI nouvelle génération.

D’abord, Romain présente les différentes formes de Business Intelligence en entreprise. On retrouve la BI exploratoire, d’entreprise et départementale.
La BI exploratoire se concentre sur des sources de données très volumineuses, peu ou pas structurées, collectées, traitées au fil de l’eau. Par contre, la BI d’entreprise se focalise sur des sources de données volumineuses stables, maitrisées et industrialisées. La BI départementale, quant à elle, regroupe les sources de données peu volumineuses, métiers, locales, évolutives et hors DSI.

Les technologies big data révolutionnent les architectures BI traditionnelles et les promesses du big data qui ont été évoquées sont les suivantes : la disponibilité pour tous les utilisateurs métier, l’intégration aux applications décisionnelles existantes, adaptation aux usages à temps réel, élasticité et massivement scale out, plateforme peu couteuse, données non ou peu structurées et structurées ainsi que grande capacité de stockage. Surtout, le big data ne doit pas finir dans un silo métier et être accessible à tous les métiers de l’entreprise.

La deuxième présentation par Bahaaldine Azarmi de Talend met en avant les produits big data de la société.

Bahaaldine explique la vision de Talend à propos du big data. Ce nouveau type de données représente un changement significatif de modèle au niveau de la technologie des entreprises. Celles-ci capturent des trillions d’octets d’informations: le désir de collecter et analyser ces données est toujours plus important.

Puis le conférencier effectue une introduction à Talend Platform for Big Data comprenant notamment des fonctionnalités avancées de collection, de traitement et de qualité de données.
Bahaaldine en vient à réaliser un job collectant des données depuis Google Cloud Storage, pour les transformer dans une plate-forme Hadoop puis charger les résultats dans Google BigQuery.

Une fois récupérées des quantités importantes de données venues du Web, on les enrichit pour les rendre exploitables et porteuses de sens. Et c’est après une connexion de Talend ESB à Google Cloud Storage que les jobs Hive sont générés graphiquement!

Christophe Baroux de Google est le troisième conférencier de la soirée et il présente Google Cloud et Google BigQuery.

Christophe détaille au public l’offre de Google pour le Cloud : Google Cloud Platform. Ce produit rend possible des usages tels que le stockage, la mobilité, les jeux, le computing à performance élevée (High Performance Computing) et big data, le développement et les tests ainsi que le marketing digital.

Le conférencier propose de passer en revue deux outils de Google, dont Google Compute Engine : il s’agit d’un produit en « Infrastructure as a Service » (IaaS) offrant une API RESTful pour la gestion de ressources comme des disques, images et autres instances.
Nous avons aussi pu en savoir plus sur Google BigQuery, permettant une analyse interactive de grandes quantités de données, pour une utilisation avec Google Storage. Il s'agit d'une IaaS qui peut être utilisée en complément de MapReduce.

En termes de chiffres, nous aurons appris que Google trie un téraoctet de données avec 1000 cœurs en 56 secondes grâce à MapR. Et à performance égale pour cette capacité, le Google Cloud, en comparaison à une ferme de serveurs standards, coute $582 pour le premier contre $584000 pour le second.
Toujours quantitativement, Google BigQuery donne la possibilité de requêter 291 millions de lignes en 1,6 secondes.

La quatrième présentation de Loïc Formont de chez QlikTech expose comment est construit une application QlikView Big Data.

L’entreprise a présenté ses solutions pour le big data, comme QlikView Business Discovery, et a mentionné que ces outils sont simples à employer, utilisables dans tous les domaines, permettent la prise de décision ainsi que la collaboration et la mobilité.
Avec Business Discovery, chaque utilisateur peut analyser ses données et y faire des découvertes. Tous peuvent accéder aux données et participer, pour prendre de meilleures décisions.

Ensuite, nous avons pu suivre la construction d'une application QlikView de type big data, s'appuyant sur les données disponibles dans le cluster Hadoop et dans BigQuery.
L’exemple se concentre sur des requêtes pour l’achat d’un billet d’avion et repose sur la recherche associative de QlikView. La démonstration s’est concentrée sur des notions telles que le trafic, les clics, visites, sessions ainsi que les KPI.

Cette soirée centrée autour du big data a couvert plusieurs technologies, dont celles de Google, Talend et QlikView. Pendant les présentations et les discussions de networking, le public aura pu mieux saisir comment certaines technologies apportent une réponse à faible cout, rapide et simple aux analyses big data. Surtout, l’évènement a permis de rassembler des participants souhaitant comprendre concrètement comment mettre en place une plate-forme big data mais aussi échanger sur des enjeux majeurs ainsi que dialoguer à propos de différents projets.

Autres articles

Abonnez-vous gratuitement à Decideo !

Retour sur le premier Apéro Big Data de Juillet 2013

IA, simplification et débureaucratisation pour transformer l'État

Neo4j et Google Cloud annoncent de nouvelles fonctionnalités GraphRAG pour les applications d’IA générative

Equadis choisit Google Cloud pour développer des solutions technologiques innovantes centrées sur les données

Sinequa étend son partenariat avec Google Cloud et offre des fonctionnalités avancées de génération augmentées de récupération (RAG)

Palladium Hotel Group tire profit de ses données grâce à Talend afin de proposer une expérience client améliorée

Le nouvel outil Webfleet Transition EV permet l’électrification des flottes par la donnée - 25/04/2024

Alteryx et DataCamp s'allient pour permettre à tous les salariés de se former à l'analyse - 25/04/2024

Quel est le futur des métiers de la data et de l’IA vu par les grands groupes français ? - 25/04/2024

OneStream Software réinvente et renforce le rôle du CFO grâce à sa nouvelle solution Narrative Reporting - 25/04/2024

Empreinte de la Donnée sur le vivant : Le Cercle de la Donnée et l’Agora 41 présentent 5 propositions pour un numérique responsable - 25/04/2024