Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Je Suis L’Opinion Mining


Rédigé par Emmanuelle Claeys, mc2i Groupe le 16 Mars 2015

Les faits tragiques du 7 au 9 janvier derniers ont choqué la France mais aussi le monde entier. Le slogan “Je suis Charlie”, né sur Twitter, nous montre comment les internautes se mobilisent et font part de leurs émotions sur la toile. Ces émotions, les Data Scientists s’y intéressent depuis longtemps, mais peut-on vraiment savoir comment va le monde grâce au Big Data ?



Emmanuelle Claeys, Consultante mc2i Groupe
Emmanuelle Claeys, Consultante mc2i Groupe
Le commencement
Démarrons en 2012 lorsque des projets ont commencé à voir le jour sur un sujet encore peu connu : l'Opinion Mining. L'idée était de créer un modèle d'analyse basé sur les échanges collectifs « peer to peer » présents dans les réseaux sociaux et les blogs.

L'Opinion Mining peut se définir comme une sous-discipline informatique, à la frontière avec l'analyse linguistique, permettant de répondre aux questions suivantes :
- Quelle est la partie du message exprimant une opinion ?
- Qui est l'auteur ?
- Quelle partie du texte a été commentée ?

Les experts avaient compris que l'explosion des réseaux sociaux permettrait aux internautes de faire entendre leurs avis. Mais le problème n'était finalement pas tant la quantité de données que la façon de les analyser : interpréter le langage humain reste, encore aujourd'hui, un challenge important, tant par la richesse d'une langue que par ses subtilités.

Quel est le support permettant de faire ces analyses ?
Twitter reste le réseau social permettant la meilleure analyse des messages de ses utilisateurs. Les messages sont généralement courts et assez clairs, et le principe de retweetage permet de mesurer l’impact d’une publication. De plus, Twitter met en open source des archives de ses tweets, permettant à des systèmes d’analyses de données de faire rapidement des reporting.

Autre outil d’analyse, Google Trends, issu de Google Labs, permet de connaître la fréquence de recherche d’un terme dans Google, avec la possibilité de visualiser ces données par région et par langue.

Mais alors comment extraire les informations des messages ?
Stefan Gindl et Arno Scharl de la MODUL University de Vienne ont développé une méthodologie d'analyse de textes complexes qui comprend les étapes suivantes :
1. Identifier les termes qui peuvent être ambigus en fonction du sentiment du rédacteur
2. Fournir des informations sur le contexte et l'intégrer dans le processus d'apprentissage automatique.
3. Contribuer à une intelligence artificielle basée sur la logique formelle.

Depuis quelques années, de nombreux scientifiques et sociologues ont fait progresser les logiciels d'Opinion Mining. Il reste néanmoins de nombreux défis encore difficiles à relever, notamment :
- Le filtrage des spams et des doublons ;
- Le développement de l'apprentissage autonome des machines et leur intelligence artificielle ;
- La détection de l'ironie.

Un visuel avec Hedonometer.org
Hedonometer est basé sur les travaux de recherche de Peter Dodds et Chris Danforth de la University of Vermont. Cet outil sélectionne un échantillon des derniers tweets publiés et injecte les mots écrits en anglais dans un système d’analyse qui attribue à chaque message un score de « bonheur » sur la base des mots qu'il contient.


Analyse de Hebdonometer sur l’attentat de Charlie Hebdo (source : hedonometer.org)
Analyse de Hebdonometer sur l’attentat de Charlie Hebdo (source : hedonometer.org)
L'Opinion Mining : Business et Politique.
L’Opinion Mining permet de mettre en avant la popularité d'un produit, l'impact d'un bad buzz, les conséquences d'une action politique, etc. Des techniques permettent de déterminer la véracité d'un élément d'information en se basant sur la réputation de son émetteur ainsi que le volume d’opinion en désaccord avec cette information.

En conclusion, nous pourrions relancer le débat suivant : les émotions peuvent-elles être calculées ? Chacun pourra se faire son opinion, mais il est certain que nombreux sont ceux qui pensent que oui et ont bien l’intention d’investir dans cette technologie.

Sources

http://davidamerland.com/seo-tips/977-sentiment-analysis-in-semantic-search-find-out-what-others-are-thinking-about-your-brand.html

https://cloud.google.com/prediction/docs/sentiment_analysis

http://www.franceinfo.fr/emission/nouveau-monde/2014-2015/comprendre-l-influence-du-temps-sur-le-moral-grace-twitter-17-11-2014-06-50




Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.