Big Data, Science des données, aide à la décision en entreprise, business intelligence, data warehouse, reporting, OLAP, web analytics, data visualization, data mining, internet des objets, informatique cognitive, intelligence artificielle...

Abonnez-vous gratuitement à Decideo !


Decideo

 


L’heure est aux technologies CDP de seconde génération


Rédigé par Frédéric Bouzy, Directeur Iron Mountain Digital le 24 Mai 2006



Par Frédéric Bouzy, Directeur Europe du Sud, Iron Mountain Digital

L’heure est aux technologies CDP de seconde génération
Le CDP (Continuous Data Protection, protection des données en continu), est l’un des derniers sujets en vogue sur le marché de la protection des données. Dans leurs récentes annonces, les ténors du secteur tels Microsoft, IBM/Tivoli et Symantec présentent tous leurs derniers produits comme assurant la protection des données en continu. C’est pourquoi le marché tend à classer tous les produits CDP dans la catégorie « nouveau ».

En fait, il existe des produits CDP depuis la fin des années 1990. Des dizaines d’éditeurs affirment vendre du CDP et ont chacun leur propre idée de ce que recouvre ce terme. Pour une mise en perspective supplémentaire, une recherche sur « CDP software » dans Google donne près de 200 000 résultats. Cela dit, si l’on cherche à savoir ce qu’il faut entendre exactement par CDP en s’efforçant de faire abstraction du battage marketing, on se rend rapidement compte que l’offre de la plupart des éditeurs est rudimentaire et ne saurait assurer la protection complète de l’activité de l’entreprise. La majorité d’entre eux prétend offrir du CDP, mais il s’agit en fait de sauvegarde et non de protection des données en continu. Le CDP en est déjà en effet à sa seconde génération et il ne se cantonne plus à la sauvegarde des données.

CDP de première génération
Le principe de base du CDP consiste à capturer et sauvegarder les modifications de données dans les fichiers à mesure — ou très peu de temps après – qu’elles interviennent. Une fois cette technologie déployée, en cas de coupure électrique, de panne système ou d’attaque virale à un instant donné, il est possible de récupérer les données sauvegardées à peine quelques minutes voire quelques secondes plus tôt. Rien de comparable, donc, avec la restauration de données à partir, au mieux, d’une copie de sauvegarde de la veille réalisée sur bande, ce qui demeure malheureusement le lot de la majeure partie des entreprises.

Aujourd’hui, les « nouvelles » solutions de CDP sont essentiellement des serveurs de disques intercalés entre le serveur à protéger et un système traditionnel de sauvegarde sur bande. Ces solutions assurent la sauvegarde en continu sur des disques locaux et le stockage de l’historique à court terme (jusqu’à quelques semaines). L’avantage est que les utilisateurs peuvent redémarrer directement à partir de leur disque et restaurer avec plus de rapidité et de facilité des données à court terme. Le service informatique doit toujours effectuer une sauvegarde nocturne sur bande des données du serveur, créer une seconde copie, en conserver une sur site et transporter l’autre dans un lieu physiquement éloigné.

Les technologies CDP sont conçues pour répondre à deux objectifs majeurs de la reprise en cas de sinistre. Le premier est le RTO (Recovery Time Objective), c’est-à-dire le délai nécessaire à une restauration complète des données. Le second est le RPO (Recovery Point Objective), à savoir le volume de données que l’entreprise peut se permettre de perdre.

Dès lors qu’une solution CDP est en place, la restauration des données peut s’effectuer rapidement puisque celles-ci sont stockées sur site sur un serveur de disques, ce qui réduit le délai de reprise de l’activité pour l’entreprise. Les technologies CDP ont un impact encore plus important sur le RPO : la sauvegarde des modifications en continu réduit au minimum, voire à néant, le volume de données perdues dans le cas de certains types de sinistres.

Cette solution paraît idéale… Pourtant elle ne constitue qu’une première étape et ne suffit pas car la sauvegarde des données en continu ne signifie pas leur protection en continu. S’il est vrai que les données sont sauvegardées en continu sur disque et qu’il est possible de les restaurer à partir du serveur de disques local, le CDP de première génération oblige toujours à réaliser une sauvegarde sur bande, avec ce que cela implique de procédures manuelles, de taux élevés d’erreurs de restauration et de travail nocturne, afin de disposer d’une copie pour conservation hors site. Il faut donc une solution supplémentaire, qu’elle soit technique ou manuelle, pour mettre les bandes en lieu sûr afin de protéger réellement les données et de pouvoir les récupérer en cas de sinistre.

CDP de seconde génération
En termes simples, le CDP de seconde génération englobe l’ensemble du processus de protection des données : sauvegarde en continu, protection continue hors site, stockage historique et capacité de restauration immédiate.

• Sauvegarde des données en continu
Le CDP de seconde génération implique de sauvegarder non seulement les modifications des fichiers, comme cela est courant dans le CDP de première génération, mais aussi les modifications critiques dans les applications métiers, serveurs de messagerie et bases de données.

• Transfert en continu des données vers un site distant sécurisé
La protection automatique hors site, également appelée sauvegarde en ligne ou, sauvegarde à distance, permet de transférer immédiatement et en continu les données de sauvegarde vers un site distant sécurisé pour les mettre à l’abri de dommages physiques.

• Possibilité de récupérer les données à partir d’un point particulier dans le temps
Pour bénéficier véritablement du CDP, il faut disposer de multiples versions récupérables correspondant à différents points de sauvegarde dans le temps. Qu’il s’agisse d’une version remontant à quelques minutes, plusieurs jours ou même plusieurs années, elle doit être aisément accessible pour une restauration chaque fois que nécessaire.

Les solutions de CDP de seconde génération automatisent et intègrent complètement l’ensemble du processus de protection des données en continu. En outre, ces solutions permettent de réaliser une restauration via le Web afin d’éliminer tout risque d’erreur humaine et de dommage physique affectant les données ou leur support. Il en résulte une capacité de récupération à 100% de toute version correspondant à l’instant de sauvegarde souhaité.

Prenons l’exemple d’un sinistre tel que le cyclone Katrina. De nombreuses entreprises ont été dans l’incapacité de récupérer quoi que ce soit. Si leurs bandes de sauvegarde étaient stockées sur site, elles ont disparu. Si elles étaient stockées hors site localement, il est probable qu’un important volume de données a été perdu. Même si elles disposaient d’une solution CDP de première génération, le serveur CDP local a sans doute été détruit. En revanche, si elles avaient mis en place un CDP de seconde génération et sauvegardé automatiquement leurs données sur des sites distants, elles auraient pu les restaurer sur un nouveau site et reprendre le cours de leurs activités dans un délai raisonnable.

Dans ces conditions, comment les entreprises peuvent-elles aujourd’hui continuer à s’en remettre à une solution qui ne remplit que partiellement sa mission et se révèle incapable de protéger efficacement leur activité ? Parce que la sauvegarde sur bande a représenté pendant de nombreuses années la solution optimale et que le CDP de première génération a fait naître des promesses que la sauvegarde sur bande à elle seule n’est pas en mesure de tenir.

Or, dans le monde aujourd’hui connecté en réseau, les données – qui constituent peut-être l’actif de le plus important de l’entreprise – ne doivent pas être mises en danger par l’emploi d’une solution de protection des données qui ne se concentre que sur la sauvegarde et reste tributaire des bandes. Face à l’accentuation des risques d’exploitation et de la dépendance vis-à-vis des données, les entreprises doivent se tourner vers des solutions de CDP de seconde génération qui prennent en charge l’ensemble du processus de protection des données, dont la sauvegarde en continu ne représente qu’un aspect. Ces nouvelles solutions intégrées éliminent presque totalement les pertes de données et réduisent considérablement les délais de restauration.

Après avoir vu la différence entre CDP de première et de seconde génération et fait la part du langage marketing parmi les diverses offres, il sera plus facile pour vous de considérer les produits disponibles et les témoignages des utilisateurs. A l’heure du choix, optez au minimum pour une authentique solution de protection des données en continu, englobant la sauvegarde en continu, le stockage sur un site distant et la mise à disposition pour restauration immédiate. Ce choix peut être déterminant pour vous permettre de poursuivre votre activité quel que soit le sinistre qui frappe votre entreprise, au lieu de faire la une des journaux à la suite de la perte catastrophique de vos données.

L’auteur :

Frédéric Bouzy est le Directeur Europe du Sud d’Iron Mountain Digital. Le pôle technologique d’Iron Mountain fournit des logiciels et des services de sauvegarde, de restauration et d’archivage de données. Iron Mountain aide les entreprises à travers le monde à réduire les coûts et les risques associés à la protection et au stockage de l’information.