Hola de nuevo:
En los post anteriores hemos hablado de deduplicación en nuestras cabinas de almacenamiento (FAS), que permiten eliminar datos redundantes, y por tanto ahorrar espacio, en el sistema que utilizamos para dar servicio de almacenamiento a servidores o usuarios.
En este post quiero revisar otra propuesta de ahorro de espacio, en este caso para las copias de seguridad realizadas con diferentes software de backup.
Es muy habitual en muchas organizaciones el disponer de una librería de cintas para realizar las copias de seguridad; durante años las cintas han sido el dispositivo por excelencia para realizar copias de seguridad. En determinados tipos de entorno, tambien se han utilizado durante mucho tiempo discos como repositorios, generalmente temporales, de copias de seguridad.
El utilizar discos para las copias de seguridad tiene algunas ventajas, ya que estos permiten mayores velocidades (y menores), se averían menos, permiten mayor número de grabaciones, los datos son accesibles inmediatamente, se evita la manipulación de cintas, etc.
Sin embargo, los discos utilizados como tales para realizar copias de seguridad tienen el problema de que la mayoría de los software de copia de seguridad funcionan mejor sobre cintas.
Para solventar este problema, hace unos pocos años se comenzaron a desarrollar los dispositivos de cintas virtuales (Virtual Tape Library), que permiten crear librerías de cintas y cintas virtuales al software de backup, pero utilizando un dispositivo basado en disco para almacenar las copias de seguridad.
Con la reducción de precio de los discos de gran volumen (ATA) y el aumento de la densidad de los mismos (acualmente los discos son de 1TB o más), en los últimos años (2-3) hemos visto un gran crecimiento en el interés por las VTLs como dispositivos temporales o permanentes para realizar copias de seguridad.
En este enlace podéis ver la información relativa a las VTLs que comercializamos en NetApp.
En la mayoría de los entornos las cintas no desaparecen, ya que los backups de larga duración (años) y los que hay sacar fuera del CPD se suelen mantener en cinta.
Lo que permiten las VTLs es que se realicen las copias de seguridad de forma más rápida, más paralela y más fiable. Adicionalmente, durante el tiempo que mantengamos esos backups en la VTL, las restauraciones son muchos más rápidas, ya que recuperar de una cinta requiere moverla físicamente (puede que manualmente desde un armario).
Lo que nos aporta la deduplicación en las VTLs es la capacidad de que almacenemos en "disco" un periodo mucho más largo de copias de seguridad, reduciendo más la cantidad de cintas a utilizar y extendiendo las ventajas en las restauraciones a periodos mucho más largos.
La explicación es sencilla, cada copia de seguridad completa (full) de un determinado entorno se parece mucho a otra copia completa realizada del mismo entorno con unos días de diferencia. Si la funcionalidad de deduplicación es capaz de encontrar esas similitudes, seremos capaces de almacenar muchos de esos backups ocupando solo la primera copia y las diferencias (si la deduplicación fuera perfecta).
En nuestro caso, la deduplicación que se implementa en las VTLs es diferente de las que se implementa en las cabinas de almacenamiento de propósito general, debido a la diferente naturaleza de los datos y del tipo de escrituras que se realizan sobre el dispositivo.
Para los que quieran más detalles, hablamos sobre el tema en este TechTalk reciente, que emitimos en directo, pero que podéis volver a ver como un video.