Decideo - Actualités sur le Big Data, Business Intelligence, Data Science, Data Mining

Abonnez-vous gratuitement à Decideo !


Decideo

 


Grâce au traitement du langage naturel à grande échelle par Neo4j, la réparation de matériel gagne en efficacité


Rédigé par Communiqué de Neo4j le 19 Juillet 2019

Caterpillar, Inc. détient plus de 27 millions de documents de suivi de réparation et de maintenance de véhicules. En utilisant Neo4j pour effectuer un traitement du langage naturel (TLN), l'entreprise peut désormais faire des recherches à grande échelle pour détecter les tendances et les problèmes issus des réparations, prescrire des solutions et faire de précieuses prédictions. Le tout afin d'améliorer l'efficacité des réparations et de la maintenance des véhicules dans toute l'entreprise.



Grâce au traitement du langage naturel à grande échelle par Neo4j, la réparation de matériel gagne en efficacité
L'entreprise

Caterpillar, Inc. est le premier fabricant mondial d'équipement de construction et d'exploitation minière, de moteurs diesel et à gaz naturel, de turbines à gaz industrielles et de locomotives diesel-électriques.

Les clients s'adressent à Caterpillar pour développer leurs actifs dans les infrastructures, l'énergie et les ressources naturelles. Son portefeuille de 20 marques offre des services et des solutions pour répondre aux besoins uniques d'une variété d'industries et de clients à travers le monde. En 2018, les ventes et le chiffre d'affaires de l'entreprise, qui existe depuis 90 ans, ont dépassé 54 milliards de dollars à l'échelle mondiale.

Le défi

À chaque fois qu'une machine de Caterpillar arrive en réparation ou en maintenance, le technicien crée un document de garantie qui enregistre la demande, l'analyse du problème et sa solution.

L'entreprise dispose ainsi d'un référentiel de documents techniques à grande échelle qui, en grande partie, présente une bonne qualité selon les standards de l'étiquetage et de la linguis- tique informatisée. Toutefois, il restait à connecter de nombreuses données hétérogènes.

Consciente que des données de valeur résidaient dans ses 27 millions de documents, l'entre- prise a lancé la création d'un outil de TLN afin de mettre à jour les tendances et les relations non-visibles.

Depuis dix ans, Caterpillar explore le TLN à des fins de gestion de maintenance des véhicules et de chaîne d'approvisionnement. Une grande partie des données a pu être cartographiée correctement dans différents domaines, sans pour autant réussir à obtenir une représentation de ces connaissances, ni à les exploiter de façon pertinente.

« Nous voulions créer un système permettant de poser n'importe quelle question tant qu'elle restait dans le domaine » explique Ryan Chandler, Data Scientist en chef chez Caterpillar. « Il fallait mettre au point un système de dialogue pour tester l'utilisation des graphes, présenter une interface utilisateur ouverte capable de répondre aux questions et développer une fonctionnalité d'interface vocale homme-machine ».

La solution

Comme les graphes constituent le premier niveau de structure d'une infrastructure et offrent une très grande flexibilité, ils conviennent naturellement au traitement du langage et au machine learning.

Les techniques de traitement du langage le plus souvent utilisées sont soit l'analyse des liens entre le verbe et les autres mots qui s'y réfèrent, soit par l'utilisation d'un arbre syntaxique. Ces deux structures sont des graphes.

Caterpillar a utilisé Neo4j pour les structures de données de graphes afin de créer un modèle logique de connaissances. Cette alternative NoSQL aux bases de données relationnelles a permis d'établir des ontologies et de faire des déductions.

Pour passer du langage naturel aux résultats d'une requête de graphes, l'équipe a mis au point une architecture de données qui intègre le texte via une boîte à outils open-source de TLN, qui utilise Python pour combiner les phrases en chaînes, ajuster les limites et ne pas tenir compte du texte inutile. Les données sont également importées depuis les systèmes ERP SAP et non SAP.

L'outil de classification de machine learning apprend à partir d'un ensemble de données déjà étiquetées avec des termes tels que cause ou demande qu'il applique ensuite au reste des données.

WordNet est utilisé comme dictionnaire lexicographique pour donner une définition aux mots, l'analyseur syntaxique de dépendances de Stanford analyse le texte et Neo4j identifie les motifs et les relations, établit les hiérarchies et ajoute les ontologies.

Le tout combiné permet aux utilisateurs de faire des recherches pertinentes à partir de simples requêtes Cypher.

Les résultats

La prescription d'une action découle naturellement du système, par exemple l'étape appropriée à suivre pour identifier le problème et son diagnostic si un moteur fait des heurts.

« Les solutions de ce genre vont beaucoup plus loin que ce que l'on peut faire avec une IA standard » déclare Morgan Vawter, directrice de l'analytique chez Caterpillar, Inc. « Elles incarnent l'état d'esprit de l'entreprise, son domaine de connaissances et sont ainsi le résultat d'une traduction minutieuse de l'humain à la machine. »




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.