Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


Elles sont grosses, grandes, massives, volumineuses, méga… mes données en français


Rédigé par le 28 Août 2014

Disclaimer : ce billet d’humeur n’a aucun intérêt, n’apporte aucune information, et si vous choisissez de ne pas le lire, vous n’aurez sans doute rien manqué ☺ You decide!

Etant en train de luncher d’un hamburger dans un Sports Bar, qui propose des soirées karaoké le mardi, il m’a semblé que le moment était bien choisi pour me lancer dans un billet convenu sur le choix des fonctionnaires français de substituer « mégadonnées » à « big data ». Ne me croyez pourtant pas installé dans la Silicon Valley (la vallée du silicium et pas du silicone !), mais au cœur d’une ville où la défense du français fait partie du quotidien. J’aurais d’ailleurs du commencer cet article par « étant en train de diner d’un hambourgeois dans un bar à sports, qui propose des soirées karaoké… » (Eh oui, dans ce cas on ne traduit pas et on conserve le mot japonais), ce n’est pas plus compliqué, mais parfaitement français.



La Commission générale de terminologie et de néologie, organisme public français, a travaillé… et publié le résultat de son travail le 22 août dernier au Journal Officiel de la République Française. On ne doit donc plus dire en France, « Big Data », mais mégadonnées, un nom féminin pluriel. Cette commission s’était déjà illustrée début 2013 en annonçant le remplacement de « hashtag » utilisé depuis des années, par « mot dièse » alors là encore que le Québec avait préconisé dès 2011 l’utilisation de « mot-clic ».
J’ai d’ailleurs aussi découvert d’autres commissions comme la Commission Spécialisée de Terminologie et de Néologie de l'Informatique et des Composants Electroniques au site web délicieusement suranné ; ou encore la Société française de terminologie

N’allez pas imaginer un instant que je vais critiquer cette francisation ! Decideo défend depuis presque 20 ans, être un outil d’information sur les outils d’aide à la décision, en français, lu en France, Belgique, Suisse, Afrique, Canada et dans bien d’autres pays où résident des francophones. Et même si le naturel revient au galop dans certains articles au travers d’anglicismes, nous tentons de privilégier au maximum notre belle langue.

Mais pourquoi attend-on autant avant de décider de l’équivalent francophone à employer. Laisser pendant plusieurs années l’ensemble des professionnels parler de Big Data, sans leur proposer/imposer une alternative, et revenir quatre ou cinq ans après pour dire : attendez ! Finalement ! Vous savez quoi ? On va changer de mot ! Une fois que les usages sont établis, il est trop tard pour imposer un nouveau terme.
Or, justement, au Québec, où la défense de la langue française est un véritable sujet politique, on a choisi d’aller vite. Il y a déjà trois ans, le terme de « données volumineuses » était employé dans les journaux pour parler du « Big Data ». Et ce terme de « données volumineuses » a été choisi dès 2011 par l’Office québécois de la langue française

La définition donnée par le dictionnaire de l’OQLF est intéressante à reproduire ici : « Ensemble des données produites en temps réel et en continu, provenant de sources hétérogènes de différents formats et dont la croissance est exponentielle. Les données volumineuses, à cause de leur démesure, deviennent impossibles à gérer avec des outils classiques de gestion de bases de données. Elles proviennent notamment des médias sociaux, des photos et des vidéos numériques transmises en ligne, des signaux des systèmes de localisation GPS des téléphones intelligents, des relevés de transaction d'achats en ligne, des données publiques mises en ligne, etc.
Elles servent à comprendre le présent et à faire des prédictions pour le monde de demain.
Le téraoctet, l'exaoctet et le pétaoctet sont les unités utilisées pour les mesurer
».

Vous noterez d’ailleurs que cette définition est à elle seule une pré-critique du mot qui sera plus tard choisi par la France : « mégadonnées », alors justement que le mégaoctet n’est pas utilisé pour mesurer des données devenues beaucoup plus volumineuses.
Ce terme apparait cependant dans la fiche de l’OQLF, mais tout en dernier, après :
données volumineuses n. f. pl.
données de masse n. f. pl.
données massives n. f. pl.
et enfin mégadonnées n. f. pl.
Certains vont même jusqu’à qualifier le choix de la commission d’aberration néologique.

En résumé, félicitons la commission ad-hoc d’avoir trouvé une traduction à « big data ». Mais blâmons là pour :
- avoir pris trois ans de plus que le Québec pour réfléchir au sujet;
- avoir choisi un terme qui prête autant à confusion, entre mégadonnées et mégaoctet ;
- ne pas savoir coordonner les traductions entre les différents pays qui utilisent la même langue. Défendre le français ce serait déjà harmoniser ces nouveaux termes entre la France, le Canada, la Belgique, la Suisse, etc.

Mais finalement, nous nous en tapons le coquillard avec une patte d’alligator femelle, comme on dit un peu vulgairement, mais en bon français. En France tout le monde continuera à parler de Big Data, certains diront « le » Big Data, d’autres « la » ou « les » Big Data, et cela n’aura aucune importance. Et au Québec, nous continuerons à essayer de parler de données volumineuses, tout en laissant échapper parfois l’anglicisme avec un sourire coupable.

Mais les français restent sans conteste les meilleurs pour discuter à l’infini du sexe des anges. Le billet annonçant cette traduction sur l’intranet de l’Alliance Big Data a généré de nombreux commentaires, souvent verbeux, et ne faisant pas avancer le sujet d’un poil. En ce qui concerne cette thématique, comme d’autres, il me semble que ceux qui en parlent le plus sont sans doute ceux qui en font le moins.

Quant à cette commission, ne serait-il pas temps de se poser :
- soit la question de son existence, si elle ne peut qu’arriver après le départ des trains ; N’y a-t-il pas quelques euros à économiser ici ?
- soit la question de sa compétence, si elle a besoin de quatre ans, là où le Québec se contente d’une année ;
- soit de lui imposer de traduire certains termes dès leur émergence, comme par exemple « data storytelling » pour lequel le Québec parle déjà de « mise en récit des données ».

Allez, sans rancune, je retourne à des articles sérieux ! Faudrait pas que mes babines prennent de l’avance sur mes bottines !




Commentaires

1.Posté par Tarek Demiati le 22/09/2014 07:36
Concernant la Francisation à outrance, est ce que l'appellation "Ingénieur d'affaires" est couramment utilisée au Canada pour évoquer la Business Intelligence ?

2.Posté par Philippe NIEUWBOURG le 22/09/2014 07:38
Pas "ingénieur d'affaires", qui ne signifie rien au Canada, mais en effet "intelligence d'affaires" qui est utilisé à la place de "business intelligence".

Nouveau commentaire :
Facebook Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.