vendredi 19 septembre 2014

Sauvegarde, réplication et archivage

Comme nous le soulignions dans notre article sur la sauvegarde et la réplication, un amalgame est souvent fait entre les différentes technologies que sont la réplication, la sauvegarde et l’archivage. Dans cet article, nous revenons sur les définitions de ces technologies afin de clarifier les choses.

Réplication de données

La réplication de données peut se résumer de la façon suivante :
  • Duplication des données sur des stockages différents
  • Cohérence des différents stockages
  • Tolérance aux pannes
Le but de la réplication est la résilience de l’accès aux données : en cas de panne, vous pouvez continuer à accéder à vos données sans interruption de service.
Le meilleur exemple reste le RAID 1, appelé également Mirroring, qui est constitué de deux disques en miroir. Cela permet de continuer le travail sur un des deux disques de la grappe si l’autre tombe en panne.
Par contre, il faut être clair sur la limite de la réplication : vos données sont cohérentes sur tous les stockages. En cas de suppression, écrasement ou virolage de vos données, impossible de les retrouver.
La réplication se positionne donc dans une logique de continuité d’activité.

Sauvegarde

Si nous devions résumer la sauvegarde nous pourrions le faire de la façon suivante :
  • Duplication des données sur un autre support
  • Mise en sécurité des données
  • Historisation des données
Pour la sauvegarde, la finalité est double : pouvoir remonter à une version antérieure de vos données et pouvoir restaurer vos données en cas de destruction de votre support source.
La limite de la sauvegarde est ce que l’on appelle la perte de données acceptable : dans le cadre d’une sauvegarde traditionnelle, nous allons prendre une photo des données à un instant. En cas de destruction du site d’exploitation, les données perdues seront celles crées et modifiées depuis la dernière sauvegarde.
La technologie de sauvegarde continue permet de palier à ce dernier point, car toute modification apportée à des données est immédiatement sauvegardée. Cependant, la sauvegarde continue à également une limite puisqu’elle est difficilement envisageable sur des données de type machines virtuelles et bases de données.
C’est la réplication qui répond à cette dernière limite, rendant la sauvegarde et la réplication assez indissociables dans une logique de disponibilité et de protection des données.
La sauvegarde est, elle, associée à une logique de reprise d’activité.

Archivage

Enfin, arrive l’archivage qui est encore très différent des deux premières technologies, car il consiste à :
  • Déplacer les données vers un autre stockage
  • Horodater les données (optionnellement)
  • Identifier les données pour classement et tri (optionnellement aussi)
La notion d’archivage est donc complètement différente de la sauvegarde et de la réplication. Son objectif n’est pas la continuité ni la reprise d’activité, mais bien de figer les données dans le temps. Nous sortons complètement de la logique de sécurité pour entrer dans une logique d’organisation des données.

Conclusion

Gardez bien ces notions en tête, car elles vous permettront de décrypter certaines offres de prestataires et d’en identifier les risques.
A titre d’exemple, il arrive fréquemment de voir des infrastructures où deux hyperviseurs travaillent sur une baie de stockage unique qui assure une « sauvegarde » en faisant des snapshots… Même si la baie stocke sur une grappe de disques RAID, la défaillance de cette même baie entrainerait un arrêt total de l’accès aux données. Et l’historisation des données étant assurée par des snapshots sur cette même baie, il n’y aurait pas de reprise d’activité possible car les données n'auraient pas été copiées vers un autre support.
Soyez donc vigilants dans le choix de vos offres de sauvegarde !