Grâce au traitement du langage naturel à grande échelle par Neo4j, la réparation de matériel gagne en efficacité

L'entreprise

Caterpillar, Inc. est le premier fabricant mondial d'équipement de construction et d'exploitation minière, de moteurs diesel et à gaz naturel, de turbines à gaz industrielles et de locomotives diesel-électriques.

Les clients s'adressent à Caterpillar pour développer leurs actifs dans les infrastructures, l'énergie et les ressources naturelles. Son portefeuille de 20 marques offre des services et des solutions pour répondre aux besoins uniques d'une variété d'industries et de clients à travers le monde. En 2018, les ventes et le chiffre d'affaires de l'entreprise, qui existe depuis 90 ans, ont dépassé 54 milliards de dollars à l'échelle mondiale.

Le défi

À chaque fois qu'une machine de Caterpillar arrive en réparation ou en maintenance, le technicien crée un document de garantie qui enregistre la demande, l'analyse du problème et sa solution.

L'entreprise dispose ainsi d'un référentiel de documents techniques à grande échelle qui, en grande partie, présente une bonne qualité selon les standards de l'étiquetage et de la linguis- tique informatisée. Toutefois, il restait à connecter de nombreuses données hétérogènes.

Consciente que des données de valeur résidaient dans ses 27 millions de documents, l'entre- prise a lancé la création d'un outil de TLN afin de mettre à jour les tendances et les relations non-visibles.

Depuis dix ans, Caterpillar explore le TLN à des fins de gestion de maintenance des véhicules et de chaîne d'approvisionnement. Une grande partie des données a pu être cartographiée correctement dans différents domaines, sans pour autant réussir à obtenir une représentation de ces connaissances, ni à les exploiter de façon pertinente.

« Nous voulions créer un système permettant de poser n'importe quelle question tant qu'elle restait dans le domaine » explique Ryan Chandler, Data Scientist en chef chez Caterpillar. « Il fallait mettre au point un système de dialogue pour tester l'utilisation des graphes, présenter une interface utilisateur ouverte capable de répondre aux questions et développer une fonctionnalité d'interface vocale homme-machine ».

La solution

Comme les graphes constituent le premier niveau de structure d'une infrastructure et offrent une très grande flexibilité, ils conviennent naturellement au traitement du langage et au machine learning.

Les techniques de traitement du langage le plus souvent utilisées sont soit l'analyse des liens entre le verbe et les autres mots qui s'y réfèrent, soit par l'utilisation d'un arbre syntaxique. Ces deux structures sont des graphes.

Caterpillar a utilisé Neo4j pour les structures de données de graphes afin de créer un modèle logique de connaissances. Cette alternative NoSQL aux bases de données relationnelles a permis d'établir des ontologies et de faire des déductions.

Pour passer du langage naturel aux résultats d'une requête de graphes, l'équipe a mis au point une architecture de données qui intègre le texte via une boîte à outils open-source de TLN, qui utilise Python pour combiner les phrases en chaînes, ajuster les limites et ne pas tenir compte du texte inutile. Les données sont également importées depuis les systèmes ERP SAP et non SAP.

L'outil de classification de machine learning apprend à partir d'un ensemble de données déjà étiquetées avec des termes tels que cause ou demande qu'il applique ensuite au reste des données.

WordNet est utilisé comme dictionnaire lexicographique pour donner une définition aux mots, l'analyseur syntaxique de dépendances de Stanford analyse le texte et Neo4j identifie les motifs et les relations, établit les hiérarchies et ajoute les ontologies.

Le tout combiné permet aux utilisateurs de faire des recherches pertinentes à partir de simples requêtes Cypher.

Les résultats

La prescription d'une action découle naturellement du système, par exemple l'étape appropriée à suivre pour identifier le problème et son diagnostic si un moteur fait des heurts.

« Les solutions de ce genre vont beaucoup plus loin que ce que l'on peut faire avec une IA standard » déclare Morgan Vawter, directrice de l'analytique chez Caterpillar, Inc. « Elles incarnent l'état d'esprit de l'entreprise, son domaine de connaissances et sont ainsi le résultat d'une traduction minutieuse de l'humain à la machine. »

Autres articles

Grâce au traitement du langage naturel à grande échelle par Neo4j, la réparation de matériel gagne en efficacité

Neo4j lance Infinigraph: la base de données de graphes la plus scalable pour unifier les charges opérationnelles et analytiques à l’échelle de 100 To+

Neo4j lance la première offre d'analyse de graphes compatible avec toutes les plateformes de données

Graphes et IA en 2025 : ce qui façonnera les technologies de demain selon Neo4j

Graphes et IA en 2025 : ce qui façonnera les technologies de demain selon Neo4j

Neo4j dépasse les 200 millions de dollars de chiffre d’affaires et accélère son leadership dans le domaine de la GenAI grâce à sa technologie de graphes

Snowflake obtient la certification "Hébergeur de Données de Santé" en France pour accélérer les usages de la donnée et de l’IA dans le secteur - 25/06/2026

De l’avenir de Teradata... - 09/03/2026

MongoDB étend ses capacités de recherche et de recherche vectorielle à ses offres autogérées - 20/09/2025

Neo4j lance Infinigraph: la base de données de graphes la plus scalable pour unifier les charges opérationnelles et analytiques à l’échelle de 100 To+ - 04/09/2025

MongoDB renforce sa plateforme et son écosystème pour les applications IA - 28/08/2025