Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


Comment Neo4j a aidé à traiter les données de #panamapapers, la plus grosse fuite de données financières de l'histoire


Rédigé par Communiqué de Neo Technology le 5 Avril 2016

Le Consortium International de Journalistes d'Investigation (ICIJ) a utilisé Neo4J, la meilleure base de données de graphes, pour fouiller dans ce qui est considéré comme la plus grosse fuite de données financière connue dans l'Histoire.



Neo Technology, créateur de Neo4j, leader mondial des bases de données de graphes, annonce que le Consortium International de Journalistes d'Investigation (ICIJ) a utilisé sa technologie afin de faire toute la lumière sur « Panama Papers », le scandale qui éclabousse de nombreuses élites mondiales et met à jour le système des activités offshore dans des paradis fiscaux.

Les données qui ont fuité décrivent les opérations internes du panaméen Mossack Fonseca, l'un des cabinets les plus réputés au monde en matière de création de sociétés offshore. Les 2,6 Téraoctets de données qui composent le dossier ont été obtenues par le quotidien allemand Süddeutsche Zeitung et partagées avec l'ICIJ, basé à Washington, qui est un réseau d'équipes d'investigations indépendantes internationales qui collabore avec plus d'une centaine de médias de tous les pays.

La pierre angulaire des nombreux scoops révélés par l'ICIJ, à l'image de Swiss Leaks (lien), n'est autre que Neo4j. C'est en fait cette technologie de base de données de graphes, utilisée avec la plateforme de visualisation Linkurious, qui a été utilisée pour organiser et permettre l'accès à ces données étroitement connectées.

La raison est simple : les bases de données de graphes excellent de deux manières. D'abord par leur capacité à gérer ces données hautement connectées, puis en permettant de répondre à des requêtes très complexes. Au lieu d'utiliser des « tables » comme le font les bases de données relationnelles, les bases de données comme Neo4j s'appuient sur la théorie des graphes et fonctionnent avec des structures spéciales comprenant des nœuds, des relations et des propriétés permettant de définir, d'identifier et de stocker les données. C'est ce qui assure à ces outils de hautes performances en termes d'analyse des relations et d'interconnexion entre les données et qui a simplifié la tâche des journalistes qui ont pu « suivre l'argent » de manière plus aisée que jamais !

Un volume de données connectées sans précédent

Selon Mar Cabra, Data and Research Unit Editor de l'ICIJ, l'utilisation de Neo4j était la seule solution viable et disponible pour répondre à ces besoins. « C'est un outil de recherche révolutionnaire qui transforme le processus d'investigation des journalistes car dans ce cas, les relations sont extrêmement importantes puisque ce sont elles qui nous montrent où sont les criminels, qui travaille avec qui, et bien plus encore. Comprendre ces relations à une très grande échelle est précisément là où les bases de données graphes excellent », explique-t-elle.

« Avec 11,5 millions de documents à traiter, bien plus que n'importe quelle fuite de données précédente, nous avions donc besoin d'une technologie qui puisse gérer un tel volume rapidement, facilement et de manière efficace ».

« Nous avions également besoin d'une solution intuitive et simple à utiliser qui ne requiert pas l'intervention de data scientists ou de développeurs tiers, afin que tous les journalistes impliqués de par le monde puissent travailler sur ces données, peu importe leur niveau de maîtrise technique. Linkurious Enterprise (https://linkurio.us/) était sans doute la meilleure plateforme pour explorer ces données et pour partager des informations de manière sécurisée. Utiliser la plateforme de visualisation Linkurious de pair avec Neo4j est une combinaison puissante et performante », ajoute Mar Cabra.

Selon Emil Eifrem, co-fondateur et PDG de Neo Technology, « Quoi que les « Panama Papers » dévoilent, une chose est sûre,, c'est uniquement avec des outils de classe mondiale comme Neo4j et Linkurious qu'il est possible de permettre une investigation internationale aussi vaste sur des données aussi complexes, comme cela se produit désormais dans notre ère de l'Information ».

« Les bases de données de graphes sont les seules solutions viables lorsqu'il s'agit de donner du sens à des térabits de données connectées entre elles comme nous les produisons de nos jours. Elles sont aussi essentielles pour les agences internationales, les gouvernements, les services financiers et les spécialistes de la sécurité à la recherche de la découverte de la vérité ».




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store