Photo de Steve Johnson sur Unsplash
L’IAG (Intelligence Artificielle Générative) est sur toutes les lèvres. Et il ne passe pas une journée sans que ne soit publié un communiqué de presse d’un éditeur de logiciels pour clamer fièrement qu’il a “intégré” ChatGPT ou un autre outil du marché. Mettez - comme moi d’ailleurs - ChatGPT dans le titre de votre article, et vous vous garantissez une excellente visibilité.
Un exemple, le dernier communiqué de Qlik sur le thème : Qlik lance une suite de connecteurs OpenAI, intégrant la puissance de l’IA générative directement dans la plateforme Qlik Analytics - https://www.decideo.fr/Qlik-lance-une-suite-de-connecteurs-OpenAI-integrant-la-puissance-de-l-IA-generative-directement-dans-la-plateforme_a13116.html
Un exemple, le dernier communiqué de Qlik sur le thème : Qlik lance une suite de connecteurs OpenAI, intégrant la puissance de l’IA générative directement dans la plateforme Qlik Analytics - https://www.decideo.fr/Qlik-lance-une-suite-de-connecteurs-OpenAI-integrant-la-puissance-de-l-IA-generative-directement-dans-la-plateforme_a13116.html
Génération automatisée de requêtes à partir de questions des utilisateurs posées en langage naturel
Des outils tels que ChatGPT sont plutôt efficaces dans la manipulation du code informatique. Ils savent l’écrire, en s’appuyant sur les milliards de lignes de code qu’ils ont analysé. Combinant cette connaissance du code, et la capacité à analyser une question, l’IAG devrait pouvoir reléguer aux oubliettes la connaissances du SQL, du GQL ou de MapReduce.
L’utilisateur se contentera de poser une question, dans sa langue, et le système la traduira en une requête. Est-ce d’ailleurs, du point de vue technologique, si différent de la traduction d’une langue à une autre ? On parle français, anglais, ou SQL…
Du point de vue technologique, des LLMs (Grands Modèles de Langage) pourront ici être utilisés, tout comme dans la rédaction de commentaires automatiques abordée ci-dessous.
Mais cet usage n’est pas nouveau :
- Wizdee en 2016 proposait déjà de lancer un outil de BI suivant ce principe : https://www.decideo.fr/A-suivre-Wizdee-de-la-BI-a-partir-de-requetes-en-langage-naturel_a8571.html mais l'entreprise ne semble plus exister.
- IBM l’annonçait dans Cognos en 2018 : https://www.decideo.fr/IBM-fusionne-Data-Science-et-Business-Intelligence-dans-le-Cloud_a10443.html
- C’est également le positionnement de ASKR.AI, présenté par Matthieu Chabeaud en 2018 : https://www.decideo.fr/26-Septembre-a-15h-Webinaire-Interrogez-vos-donnees-en-langage-naturel-avec-ASKR-AI_a10347.html
- Et aujourd’hui, Microsoft, Tableau et d’autres ont intégré ces fonctionnalités de NLP dans leurs outils.
Le déploiement des modèles d’IAG va donc permettre la démocratisation de ce mode d’interrogation par les utilisateurs. Des portails décisionnels “à la Google”, construits autour d’une simple ligne de commande - de “prompt” comme on dit maintenant - permettront à l’utilisateur d’interroger la base de connaissance décisionnelle.
L’utilisateur se contentera de poser une question, dans sa langue, et le système la traduira en une requête. Est-ce d’ailleurs, du point de vue technologique, si différent de la traduction d’une langue à une autre ? On parle français, anglais, ou SQL…
Du point de vue technologique, des LLMs (Grands Modèles de Langage) pourront ici être utilisés, tout comme dans la rédaction de commentaires automatiques abordée ci-dessous.
Mais cet usage n’est pas nouveau :
- Wizdee en 2016 proposait déjà de lancer un outil de BI suivant ce principe : https://www.decideo.fr/A-suivre-Wizdee-de-la-BI-a-partir-de-requetes-en-langage-naturel_a8571.html mais l'entreprise ne semble plus exister.
- IBM l’annonçait dans Cognos en 2018 : https://www.decideo.fr/IBM-fusionne-Data-Science-et-Business-Intelligence-dans-le-Cloud_a10443.html
- C’est également le positionnement de ASKR.AI, présenté par Matthieu Chabeaud en 2018 : https://www.decideo.fr/26-Septembre-a-15h-Webinaire-Interrogez-vos-donnees-en-langage-naturel-avec-ASKR-AI_a10347.html
- Et aujourd’hui, Microsoft, Tableau et d’autres ont intégré ces fonctionnalités de NLP dans leurs outils.
Le déploiement des modèles d’IAG va donc permettre la démocratisation de ce mode d’interrogation par les utilisateurs. Des portails décisionnels “à la Google”, construits autour d’une simple ligne de commande - de “prompt” comme on dit maintenant - permettront à l’utilisateur d’interroger la base de connaissance décisionnelle.
Rédaction de commentaires automatiques de tableaux ou graphiques
Certains aiment regarder un graphique, d’autres préfèrent lire un texte. Chacun son goût. Mais il faut reconnaitre que la rédaction d’un commentaire à partir d’un graphique n’est pas une tâche des plus gratifiantes; surtout si le commentaire se veut purement descriptif.
L’IAG, par ses capacités de rédaction, s’applique parfaitement à ce cas d’usage. A partir d’un tableau de chiffres ou d’un graphique, l’IA pourra générer un commentaire en plusieurs langues. Commenter, n’est pas donner son opinion. L’IAG en sera bien sur incapable, tout comme elle sera incapable de suggérer les actions correctrices adaptées à votre entreprise.
Mais si vous recherchez un commentaire purement descriptif pour compléter un slide par exemple, l’intégration des moteurs d’IAG aux outils d’analyse de données améliorera votre productivité.
- Dès 2016, Yseop un éditeur français, installé aux Etats-Unis, proposait déjà une solution similaire, intégrée à l’époque dans Excel et Qlik, et avait déjà le projet de l’intégrer aux autres outils BI : https://www.decideo.fr/Savvy-l-intelligence-artificielle-en-entreprise-pour-tous_a8422.html. L’entreprise toujours dirigée par un de ses fondateurs reste fortement présent sur ce domaine de l’interrogation en langage naturel, et a remporté plusieurs prix dans ce domaine.
L’IAG, par ses capacités de rédaction, s’applique parfaitement à ce cas d’usage. A partir d’un tableau de chiffres ou d’un graphique, l’IA pourra générer un commentaire en plusieurs langues. Commenter, n’est pas donner son opinion. L’IAG en sera bien sur incapable, tout comme elle sera incapable de suggérer les actions correctrices adaptées à votre entreprise.
Mais si vous recherchez un commentaire purement descriptif pour compléter un slide par exemple, l’intégration des moteurs d’IAG aux outils d’analyse de données améliorera votre productivité.
- Dès 2016, Yseop un éditeur français, installé aux Etats-Unis, proposait déjà une solution similaire, intégrée à l’époque dans Excel et Qlik, et avait déjà le projet de l’intégrer aux autres outils BI : https://www.decideo.fr/Savvy-l-intelligence-artificielle-en-entreprise-pour-tous_a8422.html. L’entreprise toujours dirigée par un de ses fondateurs reste fortement présent sur ce domaine de l’interrogation en langage naturel, et a remporté plusieurs prix dans ce domaine.
Jean Rauscher, co-fondateur de Yseop présente sa solution à la conférence Qlik en 2018 - Photo Philippe Nieuwbourg
Génération automatique de données synthétiques
Alternative à l’anonymisation des données, indispensable pour respecter le RGPD mais difficile à mettre en oeuvre par exemple pour des données de santé, la génération de données synthétiques consiste à reproduire des jeux de données, en utilisant les mêmes caractéristiques que le jeu initial, mais à partir de données inventées.
Les caractéristiques du jeu de données sont conservées; il est ainsi possible de les analyser, de réaliser des prédictions. Mais sans aucun risque de remonter à une donnée d’origine puisqu’elle n’existe pas. Les outils d’IAG pourraient être utilisés pour générer ces données synthétiques.
- En France, la société Octopize produit automatiquement ce type de données : https://www.decideo.fr/Avatar-un-article-scientifique-paru-dans-Nature-Digital-Medicine-valide-la-methode-revolutionnaire-d-anonymisation-des_a12998.html
Les caractéristiques du jeu de données sont conservées; il est ainsi possible de les analyser, de réaliser des prédictions. Mais sans aucun risque de remonter à une donnée d’origine puisqu’elle n’existe pas. Les outils d’IAG pourraient être utilisés pour générer ces données synthétiques.
- En France, la société Octopize produit automatiquement ce type de données : https://www.decideo.fr/Avatar-un-article-scientifique-paru-dans-Nature-Digital-Medicine-valide-la-methode-revolutionnaire-d-anonymisation-des_a12998.html
Détection des erreurs dans les données
Comparant les données considérées comme “justes” et les nouvelles données arrivant dans le système d’information, une intelligence artificielle pourra repérer des différences susceptibles d’être des erreurs. Des données comptables par exemple, pourront être classées en fonction du type de dépenses, du montant, de la fréquence, etc. Si une facture de fournitures de bureau de 50 000 euros apparait en milieu de mois, alors que vos factures du même fournisseur font habituellement 500 euros chaque début de mois, peut-être s’agit-il d’une erreur de saisie ou d’interprétation informatique. Des techniques d’apprentissage machine non supervisé pourront ici être utilisées, pour regrouper les transactions, et identifier les cas particuliers.
- Un sujet déjà abordé en 2019, sous le nom de “contrôle dynamique de la qualité des données” : https://www.decideo.fr/Le-controle-dynamique-de-la-qualite-des-donnees-s-invite-dans-la-montee-de-l-intelligence-artificielle_a11459.html
- Un sujet déjà abordé en 2019, sous le nom de “contrôle dynamique de la qualité des données” : https://www.decideo.fr/Le-controle-dynamique-de-la-qualite-des-donnees-s-invite-dans-la-montee-de-l-intelligence-artificielle_a11459.html
Des outils impressionnants, mais à utiliser avec précautions
Alors, pour conclure, les usages potentiels sont nombreux… mais les risques tout aussi importants. N’oubliez surtout jamais que ces systèmes ne comprennent pas, au sens humain du mot “comprendre”, et sont donc incapables de distinguer le faux du vrai. Libre à vous de confier la prochaine présentation à votre directeur général à ces outils…
Il y a juste quelques jours, je demandais à ChatGPT, devant mes stagiaires en formation, de m’expliquer les différences entre les oeufs de poule et les oeufs de coq… ce dont il s’est parfaitement acquitté, avec moultes détails sur leur mode de fécondation et leur taille (voir ci-dessus). Je reste dubitatif sur ma confiance dans l’outil pour lui confier l’explication des données décisionnelles stratégiques de mon entreprise. C’est pour l’instant un peu comme une calculatrice qui vous donnerait un résultat juste… parfois.
Autre point délicat, lorsque vous demandez à ChatGPT de rédiger le commentaire d’un tableau, vous envoyez le tableau à ChatGPT… qui l’analyse pour rédiger le commentaire. Vous avez donc envoyé, quelque part, des données peut-être confidentielles de votre entreprise, sans savoir comment elles vont être conservées, analysées, et peut-être à leur tour servir aux réponses faites à vos concurrents…
Il n’y a aucun doute que ces outils vont progresser, et ils nous seront demain indispensables. Mais pour le moment, mon conseil est : agissez avec énormément de précautions et gardez le contrôle !
Il y a juste quelques jours, je demandais à ChatGPT, devant mes stagiaires en formation, de m’expliquer les différences entre les oeufs de poule et les oeufs de coq… ce dont il s’est parfaitement acquitté, avec moultes détails sur leur mode de fécondation et leur taille (voir ci-dessus). Je reste dubitatif sur ma confiance dans l’outil pour lui confier l’explication des données décisionnelles stratégiques de mon entreprise. C’est pour l’instant un peu comme une calculatrice qui vous donnerait un résultat juste… parfois.
Autre point délicat, lorsque vous demandez à ChatGPT de rédiger le commentaire d’un tableau, vous envoyez le tableau à ChatGPT… qui l’analyse pour rédiger le commentaire. Vous avez donc envoyé, quelque part, des données peut-être confidentielles de votre entreprise, sans savoir comment elles vont être conservées, analysées, et peut-être à leur tour servir aux réponses faites à vos concurrents…
Il n’y a aucun doute que ces outils vont progresser, et ils nous seront demain indispensables. Mais pour le moment, mon conseil est : agissez avec énormément de précautions et gardez le contrôle !
Autres articles
-
Renforcer la confiance dans l’IA : les dernières améliorations de Qlik AutoML offrent une explicabilité transparente et de meilleurs résultats
-
Qlik Answers enfin disponible : une IA pour générer des insights entièrement explicables à partir de données métier non structurées
-
L’alliance entre l'innovation d'une start-up et l’industrialisation d’une grande entreprise : IBM met le modèle « Large » de Mistral à disposition sur watsonx
-
Qlik lance Qlik Talend Cloud et fournit aux entreprises un socle fiable pour l’IA
-
La dernière étude de Qlik souligne le besoin urgent d'expertise pour utiliser l’IA générative avec des données non structurées