Wikipedia envisage de se lancer dans les données structurées avec WikiData


Rédigé par le 27 Mars 2012



Le prochain projet de la fondation Wikipedia serait de construire une encyclopédie de données structurées, participative, à l'image de l'encyclopédie Wikipedia. Le projet s'appelle WikiData et viserait à apporter des réponses factuelles à des questions que tout le monde peut se poser, et dont la réponse juste est constituée par la compilation de données. Lors de la présentation récente du projet Denny Vrandecic a pris une question en exemple : "Quelles sont les dix plus grandes villes dont le maire est une femme ?". Vous pouvez peut-être trouver la réponse sur Internet, si un internaute a préalable construit cette liste et l'a publiée. Mais aucun système n'est aujourd'hui capable de comprendre votre question et d'extraire les données nécessaires au calcul de la réponse.
Un projet ambitieux, qui s'appuiera sur des données ouvertes mais également sur les bases de données publiques déjà constituées. Difficulté complémentaire, le multilingue qui obligera Wikipedia à définir les concepts dans plusieurs langues alors même que leur signification peut évoluer selon les cultures.
WikiData pourrait devenir demain une nouvelle source de données structurées, qui devra tout comme Wikipedia être manipulée avec beaucoup de précautions car elle engendrera les mêmes biais de données incomplètes ou fausses. Il faudra là encore apprendre à ne pas considérer une donnée WikiData comme juste, parce qu'elle vient de WikiData, mais développer sa propre capacité d'analyse. WikiData sera d'ailleurs plus un méta-moteur qui référencera les citations et les sources pour bâtir une synthèse factuelle d'une donnée.



Dans la même rubrique :