La migration de données dans la gestion de données


Rédigé par Patrick COFFRE, Talend le 21 Mars 2013

Dans la gestion de données, la migration de données est souvent une étape perçue comme moins stratégique que la gouvernance ou qualité de données. Pourtant, d’elle dépend le bon transfert des données, la qualité de l’information et par la suite la cohérence de l’ensemble des bases de données.
Cet article expliquera les difficultés rencontrées pendant une migration de données ; ensuite nous la comparerons à des sujets d’actualité et développerons ce que peut y apporter la qualité de données.



Patrick COFFRE, Community Manager, Talend
Une migration peut se définir comme étant le passage d'un état existant d'un système d'information ou d'une application vers une cible déterminée dans un projet ou un programme. La migration d’application, de version de bases de données ou de nouveau système ne sont pas les seuls types de migration. Les données doivent être transposées : le but d’une migration de données est de transférer les données existantes, sous un format approprié, dans le nouvel environnement.

Lors d’une migration de données, on peut rencontrer certaines difficultés, notamment parce que les migrations concernent souvent des volumes importants de données. La migration peut concerner des listes de clients, toute la comptabilité ou même l’historique de l’entreprise.
Puis, après avoir effectué la migration, une cohérence doit être maintenue entre les systèmes. Quand plusieurs bases de données ne sont pas migrées en même temps ou quand un système est implémenté de manière progressive, il faudra effectuer des synchronisations au sein de celui-ci.

La gestion de données volumineuses (qui peut faire partie d’une problématique Big Data) ou le Cloud sont des sujets d’actualité, que l’on retrouve souvent dans la presse et les médias. L’émergence de données complexes émanant des réseaux sociaux, de logs de sites web, d’archives photographiques ou vidéos, données astronomiques ou biologiques et bien d’autres ont conduit à l’essor du Big Data dans l’actualité ; l’apparition du Cloud Computing a amené un flot nouveau d’information dont on parle dans la presse spécialisée et généraliste.
Même si la migration de données est un sujet moins actuel, elle n’en reste pas moins essentielle dans la gestion de données et devrait être considérée comme un élément clé dans la gestion d’une base de données.

Suite à la migration de données, des administrateurs peuvent se retrouver avec des diminutions ou des erreurs de qualité de données : dû à l’entrée de nouvelles données dans une base, la détérioration à cause de manipulations de données, ou les changements par processus interne (traitement, nettoyage ou purge des données). Ces diminutions de qualité peuvent entrainer des erreurs de données : la qualité de données permet de corriger les problèmes éventuels.
Surtout, il s’avère important d’obtenir des données de qualité pour assurer la cohérence de l’information et avoir une base de données sure pour pouvoir effectuer des analyses fiables.


La migration de données parait essentielle pour une gestion des données réussie, même si des sujets plus en vogue ont davantage la faveur des médias. C’est pourquoi des logiciels de gestion de données comme ceux d’éditeurs open source comme Talend, qui simplifie cette étape de la gestion de données, sont particulièrement appréciés des départements informatiques de nombreuses sociétés. Avantage de ces solutions, les logiciels rendent possible par la suite de travailler sur la synchronisation, qualité ou gouvernance de données.



Dans la même rubrique :