OPE 2025 TFA INF. Tema 58. Políticas, procedimientos y métodos para la conservación de la información en soporte electrónico. Tecnologías de almacenamiento. Almacenamiento basado en objetos. Sistemas de redundancia en el almacenamiento. Nuevas tecnologías.

Servicio Andaluz de Salud EXAMEN INFORMÁTICA JUNTA DE ANDALUCÍA TFA INFORMÁTICA (P) Exámenes SAS 2025 TFA INFORMÁTICA
Tema 58: Conservación de Información y Tecnologías de Almacenamiento – SAS
TEMA 58

Conservación de Información y Tecnologías de Almacenamiento

Políticas, Métodos, Object Storage, Redundancia y Nuevas Tecnologías en el SAS

📋 Resumen Ejecutivo

Este tema aborda la conservación de información en soporte electrónico, un aspecto crítico para organizaciones modernas y especialmente vital en el sector sanitario. Se analizan las políticas y procedimientos para garantizar la preservación, integridad y disponibilidad de datos a largo plazo. Se estudian las tecnologías de almacenamiento tradicionales y emergentes: desde HDD y SSD hasta almacenamiento basado en objetos y nuevas tecnologías como DNA storage. Los sistemas de redundancia (RAID, replicación) aseguran disponibilidad y protección contra fallos. Finalmente, se examina la aplicación práctica de estas tecnologías en el Servicio Andaluz de Salud, considerando los requisitos normativos específicos del sector sanitario.

1. Introducción a la Conservación de Información

La conservación de información en soporte electrónico es el conjunto de políticas, procedimientos y tecnologías para garantizar la preservación, integridad, autenticidad y accesibilidad de datos digitales a lo largo del tiempo. En la era digital, las organizaciones generan volúmenes masivos de información que constituyen activos críticos para su operación, cumplimiento normativo y toma de decisiones.

En el contexto sanitario del SAS, la conservación de información es especialmente crítica porque:

  • Valor clínico: Las historias clínicas documentan la atención al paciente durante décadas
  • Obligación legal: Normativas exigen conservación mínima de 5-15 años (hasta permanente para historias clínicas)
  • Investigación: Datos históricos son fundamentales para investigación médica y epidemiológica
  • Protección legal: Evidencia ante reclamaciones o litigios que pueden surgir años después
  • Continuidad asistencial: Acceso a información histórica mejora diagnóstico y tratamiento

1.1. Desafíos de la Conservación Digital

Obsolescencia Tecnológica

Los formatos de archivo, medios de almacenamiento y tecnologías evolucionan rápidamente:

  • Medios físicos se degradan (cintas magnéticas, discos ópticos)
  • Formatos de archivo quedan obsoletos (WordPerfect, Lotus 1-2-3)
  • Software necesario para leer archivos ya no está disponible
  • Migración periódica necesaria pero costosa y con riesgo de pérdida

Volumen de Datos

El crecimiento exponencial de datos plantea retos de escala:

  • Imágenes médicas (PACS) crecen a tasas de TB/año
  • Logs de sistemas, sensores IoT generan datos continuamente
  • Costes de almacenamiento significativos a largo plazo
  • Complejidad de búsqueda y recuperación en grandes volúmenes

Integridad y Autenticidad

Garantizar que los datos no han sido alterados:

  • Checksums y hashes para verificar integridad
  • Firmas digitales para autenticar autoría
  • Sellado de tiempo (timestamping) para demostrar fecha
  • Pistas de auditoría inmutables

1.2. Normativa de Conservación en Sanidad

Normativa Requisito de Conservación Aplicación en SAS
Ley 41/2002 Historia clínica: mínimo 5 años desde alta de cada proceso asistencial SAS conserva historias clínicas indefinidamente en práctica
Orden 21/12/2015 Andalucía Documentación clínica: conservación permanente Digitally Born (nativo digital) y escaneado conservados permanentemente
RGPD Art. 5 Conservar solo el tiempo necesario para finalidad Definición de períodos de retención por tipo de dato
Código Penal Art. 136 Informes periciales: hasta prescripción delito (5-15 años) Conservación extendida para datos con valor probatorio
ENS (CCN-STIC 812) Copias de respaldo según criticidad del sistema Backups diarios, semanales, mensuales según sistema

2. Mapa Conceptual del Tema

🗺️ Ecosistema de Conservación y Almacenamiento

CONSERVACIÓN DE INFORMACIÓN Preservación, Integridad y Disponibilidad de Datos
POLÍTICAS Y MÉTODOS
  • • Políticas de retención
  • • Backup y recuperación
  • • Archivado
TECNOLOGÍAS STORAGE
  • • DAS, NAS, SAN
  • • HDD, SSD, NVMe
  • • Object Storage
REDUNDANCIA
  • • RAID 0/1/5/6/10
  • • Replicación
  • • Erasure Coding
NUEVAS TECNOLOGÍAS
  • • DNA Storage
  • • Holográfico
  • • MRAM, PCM
RPO/RTO Objetivos de recuperación
3-2-1 Rule Best practice backup
Deduplicación Optimización espacio
Snapshots Copias instantáneas
S3 Compatible API estándar objetos
Inmutabilidad WORM, compliance
🏥 ALMACENAMIENTO EN EL SAS
Primary Storage NetApp/HPE 3PAR – All-Flash para Diraya
PACS/RIS Object Storage para imágenes médicas
Backup Veeam + Tape LTO-9 para largo plazo
Archivo Sistema documental con conservación >50 años
Capacidad: >5 PB storage • Crecimiento: 500 TB/año • Backups: 14 días online, 7 años tape

📚 Leyenda

Concepto central
Políticas y métodos
Tecnologías
Redundancia
Aplicación SAS

3. Políticas de Conservación de Información

Las políticas de conservación establecen el marco normativo interno para la gestión del ciclo de vida de la información, desde su creación hasta su archivo o eliminación segura.

3.1. Componentes de una Política de Conservación

1. Clasificación de Información

Categorizar información según su valor, sensibilidad y requisitos legales:

  • Crítica: Historias clínicas, datos de pacientes – conservación permanente
  • Importante: Datos administrativos, financieros – 5-10 años
  • Operacional: Logs de sistemas, registros de actividad – 1-3 años
  • Temporal: Datos de trabajo, borradores – eliminar tras uso

2. Períodos de Retención

Definir cuánto tiempo debe conservarse cada tipo de información:

Tipo de Información Período de Retención Base Legal/Justificación
Historia clínica Permanente (práctica en SAS) Ley 41/2002, valor asistencial e investigación
Imágenes diagnósticas (PACS) Mínimo 5 años, recomendado permanente Valor clínico comparativo, reclamaciones
Informes de laboratorio 5 años mínimo Ley 14/1986 General de Sanidad
Recetas electrónicas 3 años Normativa farmacéutica
Datos administrativos personal 6 años desde finalización relación Obligaciones fiscales y laborales
Logs de auditoría seguridad 2 años mínimo (ENS Alto) ENS – CCN-STIC 817
Backups incrementales 14-30 días Política interna recuperación
Backups mensuales 1 año Política interna recuperación

3. Responsabilidades

  • Data Owner: Responsable del contenido y clasificación de la información
  • Data Custodian: TI responsable de implementar controles técnicos de conservación
  • DPO (Delegado Protección Datos): Supervisa cumplimiento RGPD
  • Records Manager: Gestiona archivo y destrucción segura

4. Procesos de Eliminación Segura

Procedimientos para eliminar información cuando expire su período de retención:

  • Borrado seguro: Sobrescritura múltiple (DoD 5220.22-M, 7 pasadas)
  • Degaussing: Desmagnetización de cintas y discos magnéticos
  • Destrucción física: Trituración de discos, incineración de cintas
  • Certificación: Documentar destrucción con certificado para auditorías

⛔ Errores Comunes en Políticas de Conservación

  • Conservar todo indefinidamente: Costes insostenibles y riesgo RGPD (minimización de datos)
  • No documentar períodos de retención: Incumplimiento normativo, dificultad ante auditorías
  • Políticas genéricas: No adaptadas a requisitos específicos del sector sanitario
  • Falta de revisión: Políticas obsoletas que no reflejan cambios normativos
  • No formar al personal: Incumplimiento por desconocimiento

3.2. Ciclo de Vida de la Información

El Information Lifecycle Management (ILM) automatiza la gestión de datos según su edad y valor:

  1. Creación: Información generada o capturada, clasificación inicial
  2. Uso activo: Acceso frecuente, almacenamiento primario de alto rendimiento (SSD)
  3. Uso ocasional: Acceso esporádico, migración a almacenamiento económico (HDD, nearline)
  4. Archivo: Acceso muy raro, almacenamiento de bajo coste (object storage, tape)
  5. Eliminación: Expirado período de retención, destrucción segura certificada

✅ Best Practice: Storage Tiering Automatizado

Implementar políticas automatizadas que muevan datos entre niveles de almacenamiento según edad y acceso:

  • Tier 0 (Flash/NVMe): Datos críticos en uso activo (Diraya transaccional) – < 30 días
  • Tier 1 (SSD SATA): Datos frecuentes menos críticos – 30-90 días
  • Tier 2 (HDD): Datos ocasionales – 90 días a 1 año
  • Tier 3 (Object Storage): Archivo largo plazo – > 1 año
  • Tier 4 (Tape): Archivo regulatorio, backup offline – permanente

4. Métodos de Backup y Recuperación

El backup es el proceso de crear copias de seguridad de datos para recuperarlos ante pérdida, corrupción o desastre. Es el último recurso de protección de información.

4.1. Tipos de Backup

Backup Completo (Full Backup)

  • Qué copia: Todos los datos seleccionados, sin excepción
  • Ventajas: Recuperación más rápida (una sola copia), simple de gestionar
  • Desventajas: Lento de ejecutar, consume mucho espacio de almacenamiento
  • Uso típico: Semanal o mensual como base

Backup Incremental

  • Qué copia: Solo archivos modificados desde el último backup (full o incremental)
  • Ventajas: Rápido de ejecutar, mínimo espacio de almacenamiento
  • Desventajas: Recuperación lenta (necesita full + todos los incrementales), más complejo
  • Uso típico: Diario en días laborables

Backup Diferencial

  • Qué copia: Archivos modificados desde el último backup completo
  • Ventajas: Recuperación más rápida que incremental (solo full + último diferencial)
  • Desventajas: Cada diferencial crece en tamaño, más lento que incremental
  • Uso típico: Diario cuando se prioriza tiempo de recuperación sobre espacio

ℹ️ Ejemplo de Estrategia de Backup en el SAS

Sistema Diraya (HSE):

  • Domingo: Full backup (tarda 8 horas, genera 10 TB)
  • Lunes-Sábado: Incremental diario (tarda 1 hora, genera 500 GB/día)
  • Retención: 14 días online en disco, luego a tape
  • Recuperación: Requiere full del domingo + incrementales lun-vie = ~5 horas

Imágenes PACS:

  • Replicación continua a segundo data center
  • Snapshot diario mantenido 7 días
  • Backup mensual a object storage para archivo

4.2. Estrategia 3-2-1 de Backup

La regla 3-2-1 es el estándar de oro para backup efectivo:

  • 3 copias: Datos originales + 2 backups
  • 2 medios diferentes: Disco + tape, o disco + cloud (protección contra fallo de tecnología)
  • 1 copia offsite: Geográficamente separada (protección contra desastre local – incendio, inundación)

⚠️ Variante 3-2-1-1-0 Moderna

Extensión de la regla 3-2-1 para amenazas actuales:

  • 3-2-1 (como antes)
  • +1 copia inmutable/offline: Protección contra ransomware (no puede ser cifrada por malware)
  • 0 errores: Verificación regular de integridad de backups (test de restauración)

4.3. RPO y RTO

Métricas fundamentales para definir estrategia de backup y DR:

RPO – Recovery Point Objective

  • Definición: Cantidad máxima de datos que la organización puede permitirse perder (medido en tiempo)
  • Ejemplo: RPO de 4 horas significa que backups deben ejecutarse cada 4 horas máximo
  • Implicaciones: RPO bajo requiere backups más frecuentes o replicación continua
  • SAS: RPO de 15 minutos para Diraya (replicación), 24 horas para sistemas no críticos

RTO – Recovery Time Objective

  • Definición: Tiempo máximo tolerable para restaurar un sistema tras un fallo
  • Ejemplo: RTO de 1 hora significa que el sistema debe estar operativo en máximo 1 hora
  • Implicaciones: RTO bajo requiere infraestructura de recuperación lista (standby, HA)
  • SAS: RTO de 1 hora para Diraya, 4 horas para Receta XXI, 24 horas para sistemas administrativos

4.4. Tecnologías Avanzadas de Backup

Deduplicación

Elimina bloques de datos duplicados, almacenando solo una copia única:

  • Ratio típico: 10:1 a 50:1 en entornos de servidores virtualizados
  • Source vs Target: Dedup en origen (cliente) o destino (servidor backup)
  • Inline vs Post-process: Dedup al escribir o después en batch
  • Ahorro: Reduce espacio de almacenamiento y ancho de banda de replicación

Snapshots

Copias instantáneas point-in-time de volúmenes de almacenamiento:

  • Copy-on-Write (CoW): Solo cambios se escriben, snapshot usa pointers a datos originales
  • Redirect-on-Write (RoW): Datos originales no se modifican, nuevos datos en nueva ubicación
  • Uso: Recuperación rápida de archivos individuales, protección contra ransomware
  • Limitación: No es backup real (mismo storage físico), complementa pero no reemplaza backup

Continuous Data Protection (CDP)

  • Concepto: Captura cada cambio en datos en tiempo real
  • Recuperación: A cualquier punto en el tiempo con precisión de segundos
  • RPO: Cercano a cero (pérdida de datos mínima)
  • Coste: Alto consumo de recursos, típicamente solo para sistemas críticos

5. Tecnologías de Almacenamiento

5.1. Arquitecturas de Almacenamiento

DAS – Direct Attached Storage

Almacenamiento conectado directamente a un servidor:

  • Conexión: SATA, SAS, NVMe directamente en el servidor
  • Ventajas: Simple, económico, alto rendimiento (sin overhead de red)
  • Desventajas: No compartible entre servidores, escalabilidad limitada, gestión descentralizada
  • Uso típico: Servidores individuales, estaciones de trabajo de alto rendimiento

NAS – Network Attached Storage

Almacenamiento dedicado conectado a red, ofrece almacenamiento a nivel de archivo:

  • Protocolos: NFS (Unix/Linux), SMB/CIFS (Windows), AFP (macOS)
  • Ventajas: Compartible entre múltiples servidores, gestión centralizada, fácil de configurar
  • Desventajas: Rendimiento limitado por red, no ideal para bases de datos (overhead protocolos de archivo)
  • Uso típico: Compartición de archivos, home directories, repositorios de documentos
  • Productos: NetApp FAS/AFF, Dell EMC Isilon, QNAP, Synology

SAN – Storage Area Network

Red dedicada de almacenamiento de alto rendimiento a nivel de bloques:

  • Protocolos: Fibre Channel (FC), iSCSI, FCoE (FC over Ethernet)
  • Ventajas: Muy alto rendimiento, baja latencia, consolidación de almacenamiento, snapshots y replicación avanzados
  • Desventajas: Complejo de diseñar y gestionar, coste elevado (switches FC, HBAs)
  • Uso típico: Bases de datos críticas, virtualización (VMware VMFS), aplicaciones transaccionales
  • Productos: NetApp (FAS/AFF), HPE 3PAR/Nimble, Dell EMC Unity/PowerMax, Pure Storage FlashArray
Característica DAS NAS SAN
Nivel de acceso Bloque Archivo Bloque
Compartible No Sí (múltiples clientes) Sí (LUN asignados a servidores)
Rendimiento Muy alto Medio (limitado por red) Muy alto
Complejidad Baja Media Alta
Coste Bajo Medio Alto
Escalabilidad Limitada Buena Excelente
Uso típico Servidores individuales File sharing, repositorios BBDD, virtualización, apps críticas

5.2. Dispositivos de Almacenamiento

HDD – Hard Disk Drive

Discos magnéticos rotacionales, tecnología tradicional:

  • Velocidades: 5,400 RPM (low-power), 7,200 RPM (standard), 10,000 RPM (enterprise), 15,000 RPM (alto rendimiento, obsoleto)
  • Capacidad: Hasta 20 TB por disco (2024)
  • Rendimiento: 100-200 IOPS, latencia 5-10 ms
  • Coste: €15-30 por TB
  • Durabilidad: 3-5 años típicamente, tolerancia a escrituras ilimitada (vs SSD)
  • Ventajas: Económico para grandes capacidades, maduro y fiable
  • Desventajas: Lento, frágil mecánicamente, consume más energía
  • Uso actual: Almacenamiento masivo (archivo, nearline, backup)

SSD – Solid State Drive

Almacenamiento basado en memoria flash NAND sin partes móviles:

  • Tipos de NAND:
    • SLC (Single-Level Cell): 1 bit/celda, máxima durabilidad y rendimiento, muy caro
    • MLC (Multi-Level Cell): 2 bits/celda, balance rendimiento/coste
    • TLC (Triple-Level Cell): 3 bits/celda, más capacidad, menor durabilidad, consumo
    • QLC (Quad-Level Cell): 4 bits/celda, máxima capacidad, menor rendimiento/durabilidad, económico
  • Interfaces: SATA III (600 MB/s), SAS (12 Gb/s), NVMe PCIe (hasta 7,000 MB/s)
  • Capacidad: Hasta 100 TB por SSD enterprise (Samsung PM1733)
  • Rendimiento: 50,000-100,000 IOPS (SATA), 1,000,000+ IOPS (NVMe), latencia <100 µs
  • Coste: €80-200 por TB (SATA), €150-400 por TB (NVMe enterprise)
  • Durabilidad: DWPD (Drive Writes Per Day) típico 1-10 durante garantía de 5 años
  • Ventajas: Muy rápido, bajo consumo, resistente a golpes, silencioso
  • Desventajas: Más caro que HDD, escrituras limitadas
  • Uso: Almacenamiento primario, bases de datos, VM datastores

NVMe – Non-Volatile Memory Express

Protocolo optimizado para SSDs, utiliza bus PCIe:

  • Factor de forma: U.2 (2.5″), M.2 (tarjeta), AIC (Add-In Card PCIe), U.3 (universal)
  • Rendimiento: PCIe 4.0: hasta 7 GB/s lectura secuencial, PCIe 5.0: hasta 14 GB/s
  • Latencia: ~10 µs (10x más rápido que SSD SATA)
  • Colas: 64K colas de comandos vs 32 en SATA (paralelización masiva)
  • Uso: Tier 0 storage para workloads ultra-exigentes (OLTP, VDI, analytics)

Cintas Magnéticas (Tape)

Tecnología secuencial para archivo y backup de largo plazo:

  • Estándares LTO (Linear Tape-Open):
    • LTO-8: 12 TB nativo, 30 TB comprimido
    • LTO-9: 18 TB nativo, 45 TB comprimido (actual, 2024)
    • LTO-10: 36 TB nativo, 90 TB comprimido (roadmap 2026)
  • Velocidad: 300-400 MB/s transferencia sostenida
  • Durabilidad: 30 años vida útil en condiciones óptimas
  • Coste: €5-10 por TB (más económico para archivo masivo)
  • Ventajas: Muy económico a escala, durabilidad, portabilidad offsite, inmune a ransomware (offline)
  • Desventajas: Acceso secuencial (lento para archivos individuales), requiere robotica (librerías)
  • Uso: Backup de largo plazo, archivo regulatorio, DR offsite

✅ Estrategia de Storage Tiering en el SAS

  • Tier 0 – NVMe All-Flash: Diraya BBDD transaccional (Oracle, PostgreSQL) – 50 TB
  • Tier 1 – SSD SATA/SAS: VMware datastores, aplicaciones – 500 TB
  • Tier 2 – HDD 7.2K: File shares, PACS archive >1 año – 2 PB
  • Tier 3 – Object Storage: Archivo documental, imágenes antiguas – 3 PB
  • Tier 4 – Tape LTO-9: Backups mensuales, archivo legal – 5 PB

6. Almacenamiento Basado en Objetos (Object Storage)

Object Storage es una arquitectura de almacenamiento que gestiona datos como objetos, en lugar de jerarquía de archivos (NAS) o bloques (SAN). Cada objeto contiene datos, metadatos extensibles y un identificador único global (UUID).

6.1. Arquitectura de Object Storage

Componentes de un Objeto

  • Datos: Contenido del objeto (archivo, imagen, video, documento)
  • Metadatos: Atributos descriptivos extensibles (autor, fecha, tipo, etiquetas custom)
  • ID único: Identificador global inmutable (no depende de ubicación física)

Características Clave

  • Espacio plano: Sin jerarquía de directorios, todos los objetos en un único namespace
  • Escalabilidad masiva: Billones de objetos, exabytes de capacidad
  • API REST: Acceso vía HTTP/HTTPS (GET, PUT, DELETE), S3-compatible estándar de facto
  • Durabilidad extrema: 11 nueves (99.999999999%) mediante erasure coding
  • Metadatos ricos: Búsqueda y clasificación avanzada
  • Inmutabilidad opcional: WORM (Write Once Read Many) para compliance

6.2. Ventajas del Object Storage

  • Escalabilidad ilimitada: Añadir nodos escala capacidad y rendimiento linealmente
  • Coste-eficiencia: Usar hardware commodity, economías de escala masivas
  • Durabilidad: Erasure coding protege contra fallos de múltiples discos/nodos
  • Metadatos extensibles: Búsqueda y clasificación sin escanear contenido
  • Multi-tenant: Aislamiento lógico de múltiples aplicaciones/clientes
  • Geo-distribución: Replicación automática entre data centers
  • Integración cloud: API S3 estándar, portabilidad multi-cloud

6.3. Casos de Uso de Object Storage

  • Archivo de datos no estructurados: Documentos, imágenes, videos, logs
  • PACS/RIS médico: Almacenamiento de imágenes DICOM a escala
  • Backup y DR: Destino económico para backups de largo plazo
  • Content repositories: Media, assets digitales, repositorios web
  • Big Data y Analytics: Data lakes para análisis masivo (Hadoop, Spark)
  • Cloud storage backend: Infrastructure-as-a-Service storage tier

6.4. Principales Plataformas de Object Storage

Producto Proveedor Tipo Características
Amazon S3 AWS Cloud público Estándar de facto, 11 nueves durabilidad, storage classes (Glacier)
Azure Blob Storage Microsoft Cloud público Integración Azure, hot/cool/archive tiers, WORM inmutable
Google Cloud Storage Google Cloud público Multi-regional, nearline/coldline tiers, ML integration
Dell EMC ECS Dell EMC On-premise S3/Swift compatible, geo-replication, compliance features
NetApp StorageGRID NetApp On-premise/hybrid ILM policies, multi-site, S3 compatible, FabricPool integration
MinIO MinIO Inc. Open source S3 compatible, Kubernetes-native, alto rendimiento
Ceph Red Hat Open source Unified storage (object, block, file), RADOS, usado por OpenStack

6.5. S3 API – Estándar de Facto

Amazon S3 API se ha convertido en el estándar para object storage:

Operaciones Básicas

  • PUT Object: Subir objeto a bucket
  • GET Object: Descargar objeto
  • DELETE Object: Eliminar objeto
  • LIST Objects: Listar objetos en bucket
  • HEAD Object: Obtener metadatos sin descargar contenido

Conceptos

  • Bucket: Contenedor lógico de objetos (namespace global)
  • Key: Nombre único del objeto dentro del bucket
  • Version ID: Versionado de objetos (protección contra borrado accidental)
  • Storage Class: S3 Standard, Infrequent Access, Glacier (costes decrecientes, latencias crecientes)
  • Lifecycle policies: Automatizar transiciones entre storage classes y expiración

ℹ️ Object Storage para PACS en el SAS

El SAS está migrando almacenamiento de imágenes DICOM (PACS/RIS) a object storage:

  • Volumen: 2 PB de imágenes, crecimiento 300 TB/año
  • Solución: Dell EMC ECS on-premise con API S3
  • Beneficios:
    • Escalabilidad: crecer sin límite con nodos commodity
    • Durabilidad: erasure coding 12+4 (tolerancia a 4 fallos simultáneos)
    • Coste: 70% reducción vs SAN tradicional
    • Geo-replicación: copia automática a CPD secundario
    • Metadatos DICOM: indexación para búsqueda rápida por paciente/estudio
  • Arquitectura: PACS escribe vía S3 API a ECS, imágenes >5 años se mueven a tier económico automáticamente

7. Sistemas de Redundancia en el Almacenamiento

La redundancia protege contra pérdida de datos ante fallos de hardware, proporcionando alta disponibilidad y durabilidad.

7.1. RAID – Redundant Array of Independent Disks

RAID combina múltiples discos físicos en una unidad lógica con redundancia y/o rendimiento mejorado.

RAID 0 – Striping (Sin Redundancia)

  • Funcionamiento: Datos distribuidos en bloques (stripes) entre N discos
  • Capacidad: N × capacidad disco
  • Rendimiento: N × rendimiento de disco único (lectura y escritura)
  • Tolerancia a fallos: NINGUNA – fallo de cualquier disco pierde todos los datos
  • Uso: Solo para datos no críticos donde se prioriza máximo rendimiento (video editing, scratch space)

RAID 1 – Mirroring

  • Funcionamiento: Datos duplicados en N discos (típicamente N=2)
  • Capacidad: Capacidad de 1 disco (resto es copia)
  • Rendimiento: Lectura: N × (múltiples lecturas paralelas), Escritura: 1× (escribir en todos)
  • Tolerancia a fallos: N-1 discos pueden fallar
  • Overhead: 50% (con 2 discos), 66% (con 3 discos)
  • Uso: Sistemas operativos, logs, datos críticos pequeños

RAID 5 – Striping con Paridad Distribuida

  • Funcionamiento: Datos en stripes con paridad distribuida en todos los discos
  • Mínimo discos: 3
  • Capacidad: (N-1) × capacidad disco
  • Rendimiento: Lectura: bueno (stripes), Escritura: medio (calcular paridad)
  • Tolerancia a fallos: 1 disco puede fallar
  • Overhead: 1/N (33% con 3 discos, 20% con 5 discos)
  • Limitación: Reconstrucción lenta con discos grandes, riesgo de segundo fallo durante rebuild
  • Uso: Datos de propósito general, balance capacidad/protección

RAID 6 – Striping con Doble Paridad

  • Funcionamiento: Como RAID 5 pero con dos bloques de paridad (P y Q)
  • Mínimo discos: 4
  • Capacidad: (N-2) × capacidad disco
  • Rendimiento: Lectura: bueno, Escritura: menor que RAID 5 (doble paridad)
  • Tolerancia a fallos: 2 discos pueden fallar simultáneamente
  • Overhead: 2/N (50% con 4 discos, 33% con 6 discos, 20% con 10 discos)
  • Ventaja: Mayor seguridad que RAID 5, esencial con discos >2 TB
  • Uso: Almacenamiento enterprise, archivos críticos

RAID 10 (1+0) – Mirroring + Striping

  • Funcionamiento: Pares de discos en RAID 1, luego striping RAID 0 sobre los pares
  • Mínimo discos: 4
  • Capacidad: N/2 × capacidad disco
  • Rendimiento: Excelente lectura y escritura (mejor que RAID 5/6)
  • Tolerancia a fallos: 1 disco por par puede fallar (hasta N/2 discos si están en pares diferentes)
  • Overhead: 50% siempre
  • Ventaja: Mejor rendimiento que RAID 6, reconstrucción más rápida
  • Uso: Bases de datos transaccionales, workloads de alta escritura
RAID Mín. Discos Tolerancia Fallos Capacidad Útil Rendimiento Uso Recomendado
RAID 0 2 0 discos 100% Excelente Scratch, temporal (NO producción)
RAID 1 2 N-1 discos 1/N Lectura buena, Escritura media SO, logs, datos críticos pequeños
RAID 5 3 1 disco (N-1)/N Lectura buena, Escritura media Propósito general, file servers
RAID 6 4 2 discos (N-2)/N Lectura buena, Escritura baja Archive, datos críticos grandes
RAID 10 4 1 disco/par 50% Excelente Bases de datos, alta transaccionalidad

⛔ Limitaciones de RAID

  • No es backup: RAID protege contra fallo de hardware, NO contra corrupción, borrado accidental, ransomware
  • URE (Unrecoverable Read Errors): Con discos grandes (>8TB), alta probabilidad de URE durante rebuild, causando fallo total del array
  • Ventana de vulnerabilidad: Durante rebuild (horas/días), array opera degradado sin redundancia
  • Performance degradation: Durante rebuild, rendimiento severamente impactado
  • Controller como SPOF: Controladora RAID puede fallar (usar RAID doble controladora)

7.2. Erasure Coding

Alternativa moderna a RAID para almacenamiento distribuido (object storage, cloud):

Funcionamiento

  • Esquema K+M: Datos divididos en K fragmentos, se generan M fragmentos de paridad
  • Recuperación: Solo se necesitan K fragmentos cualesquiera (de K+M totales) para reconstruir datos
  • Ejemplo 12+4: 12 fragmentos de datos + 4 de paridad = tolerar pérdida de 4 fragmentos

Ventajas sobre RAID

  • Overhead menor: 12+4 = 33% overhead vs 50% de RAID 6 o RAID 10
  • Escalabilidad: Funciona a través de nodos/data centers, no limitado a un servidor
  • Flexibilidad: Esquemas ajustables según durabilidad deseada (8+4, 12+4, 17+3)
  • Geo-distribución: Fragmentos distribuidos geográficamente (protección contra desastres)

Casos de Uso

  • Object storage (S3, Azure Blob, Google Cloud Storage)
  • Sistemas de archivos distribuidos (Ceph, GlusterFS)
  • Backup a cloud (para reducir coste de almacenamiento)

7.3. Replicación

Copiar datos a múltiples ubicaciones para disponibilidad y disaster recovery:

Replicación Síncrona

  • Funcionamiento: Escritura se confirma solo cuando datos están en ambas ubicaciones
  • Ventajas: RPO=0 (sin pérdida de datos), consistencia garantizada
  • Desventajas: Latencia de escritura (limitado por latencia de red), requiere enlaces de muy baja latencia (<10ms)
  • Distancia: Típicamente <100 km (metro/campus)
  • Uso: Aplicaciones críticas que no toleran pérdida de datos

Replicación Asíncrona

  • Funcionamiento: Escritura se confirma localmente, replicación ocurre en background
  • Ventajas: Sin impacto en latencia local, funciona a cualquier distancia
  • Desventajas: RPO > 0 (posible pérdida de datos en ventana de replicación), posible inconsistencia
  • Distancia: Ilimitada (intercontinental)
  • Uso: Disaster recovery entre data centers distantes

Replicación a Nivel de Storage vs Aplicación

  • Storage-based: Array de storage replica a otro array (NetApp SnapMirror, EMC SRDF)
  • Application-based: Aplicación gestiona replicación (Oracle DataGuard, PostgreSQL streaming replication, MongoDB replica sets)
  • Host-based: Software en servidor replica (rsync, DRBD)

8. Nuevas Tecnologías de Almacenamiento

8.1. Tecnologías Emergentes en Investigación

DNA Storage – Almacenamiento en ADN

Codificar datos digitales en secuencias de ADN sintético:

  • Densidad: 215 PB por gramo de ADN (1 millón de veces más denso que HDD)
  • Durabilidad: Miles de años en condiciones óptimas (ADN de fósiles sobrevive milenios)
  • Estado: Investigación (Microsoft, Twist Bioscience) – demostrado a escala de MB
  • Desafíos: Coste prohibitivo de síntesis y secuenciación ($1000/MB hoy), velocidad muy lenta
  • Futuro: Archivo ultra-largo plazo (décadas/siglos) cuando madure

Holographic Storage – Almacenamiento Holográfico

  • Concepto: Almacenar datos en 3D dentro de cristales/polímeros mediante hologramas
  • Densidad: TB por disco del tamaño de CD
  • Velocidad: Acceso paralelo a múltiples páginas de datos simultáneamente
  • Estado: Prototipos comerciales (Sony, InPhase Technologies ya desaparecida)
  • Desafíos: Estabilidad de los medios, coste, complejidad

5D Optical Storage

  • Concepto: Grabar datos en vidrio de cuarzo con láser femtosegundo en múltiples dimensiones
  • Capacidad: 360 TB por disco de cuarzo
  • Durabilidad: Billones de años a temperatura ambiente
  • Velocidad escritura: Lenta (1 MB/s)
  • Estado: Universidad de Southampton – demostrado, no comercial
  • Futuro: Archivo permanente de humanidad (bibliotecas, genoma humano)

8.2. Tecnologías en Adopción Temprana

PCM – Phase-Change Memory

  • Concepto: Memoria que cambia entre estados cristalino y amorfo
  • Características: No volátil, más rápido que flash, mayor durabilidad
  • Ventajas: 1000× más rápido que SSD, escrituras ilimitadas (vs SSD limitado)
  • Productos: Intel Optane (3D XPoint basado en PCM) – discontinuado 2022 por bajo volumen
  • Futuro: Potencial como «storage class memory» entre RAM y SSD

MRAM – Magnetoresistive RAM

  • Concepto: Almacena datos en orientación magnética
  • Ventajas: No volátil, muy rápido (ns), escrituras ilimitadas, bajo consumo
  • Productos: Everspin – usado en aplicaciones industriales/aeroespaciales
  • Limitación: Capacidad limitada (hasta 1 GB), coste muy alto
  • Futuro: Reemplazo de SRAM en CPUs, caché persistente

QLC NAND Evolution

  • PLC (Penta-Level Cell): 5 bits por celda en desarrollo
  • Impacto: Mayor capacidad y menor coste por TB
  • Trade-off: Menor rendimiento y durabilidad que TLC/MLC
  • Uso futuro: Read-intensive workloads, cold storage, nearline

8.3. Computational Storage

Procesamiento de datos directamente en el dispositivo de almacenamiento:

  • Concepto: SSDs con procesadores integrados ejecutan operaciones (filtrado, compresión, búsqueda)
  • Beneficios: Reducir movimiento de datos (más eficiente energéticamente), menor latencia
  • Casos de uso: Databases (filtrado), ML inference, video transcoding, compresión
  • Productos: Samsung SmartSSD, NGD Systems, ScaleFlux
  • Adopción: Nicho actualmente, potencial en analytics y edge computing

8.4. CXL – Compute Express Link

Nuevo estándar de interconexión que permitirá memory pooling y shared memory entre CPUs y aceleradores:

  • Versión: CXL 3.0 (2022), soporta hasta 256 GB/s
  • Impacto storage: Persistent memory compartida, storage class memory accesible como RAM
  • Futuro: Arquitecturas desagregadas donde storage, memoria y compute son pools independientes

ℹ️ Adopción Realista en el SAS (2025-2030)

Tecnologías que el SAS considerará adoptar en próximos 5 años:

  • 2024-2025: NVMe over Fabrics (NVMe-oF) para SANs de nueva generación
  • 2025-2026: QLC SSDs para storage nearline económico
  • 2026-2027: Computational Storage para PACS (pre-procesamiento de imágenes)
  • 2027-2028: CXL memory pooling en servidores críticos
  • Largo plazo: DNA storage solo si baja coste 1000× – para archivo cultural/científico

No adoptará: Holographic storage (inmaduro), 5D optical (no comercial), Optane (discontinuado)

9. Conservación de Información en el SAS

9.1. Arquitectura de Almacenamiento del SAS

Primary Storage – Producción

  • Plataforma: NetApp AFF A700 All-Flash + HPE 3PAR para workloads legacy
  • Capacidad: 500 TB útil, RAID 6 + hot spare
  • Workloads: Diraya transaccional, Receta XXI, bases de datos Oracle/PostgreSQL
  • Rendimiento: >500,000 IOPS, latencia <1 ms
  • Disponibilidad: Dual-controller active-active, 99.999%

Secondary Storage – PACS/RIS

  • Plataforma: Dell EMC ECS Object Storage
  • Capacidad: 2 PB, creciendo 300 TB/año
  • Protección: Erasure coding 12+4, geo-replicación a CPD secundario
  • API: S3-compatible para integración con PACS vendors

Backup Infrastructure

  • Software: Veeam Backup & Replication v12
  • Target primario: NetApp E-Series con deduplicación (600 TB útil, 3 PB lógico con dedup 5:1)
  • Target secundario: IBM TS4500 tape library con LTO-9 (capacidad 5 PB)
  • Retención:
    • Backups diarios: 14 días en disco
    • Backups semanales: 8 semanas en disco
    • Backups mensuales: 7 años en tape

9.2. Políticas de Conservación del SAS

Sistema/Datos Frecuencia Backup Retención Online Retención Offline/Tape RPO RTO
Diraya (BBDD) Incremental cada 4h + Full semanal 14 días Mensual 7 años 15 min 1 hora
PACS imágenes Replicación continua + Snapshot diario 30 días snapshots Permanente en object storage 0 4 horas
Receta XXI Incremental diario + Full semanal 14 días Mensual 3 años 24 horas 4 horas
Sistemas administrativos Incremental diario + Full semanal 7 días Mensual 7 años 24 horas 8 horas
File shares Snapshot diario 30 días No 24 horas 1 hora

9.3. Cumplimiento Normativo

ENS – Esquema Nacional de Seguridad

  • Categoría: ALTA para sistemas con datos de salud
  • Control op.exp.2 (Backup): Copias de respaldo según criticidad, protegidas y verificadas
  • Implementación SAS:
    • Backups automáticos diarios verificados
    • Copias en ubicación separada (CPD secundario + tape offsite)
    • Test de restauración trimestral de sistemas críticos
    • Cifrado AES-256 de backups

RGPD – Protección de Datos

  • Art. 32: Medidas técnicas apropiadas – backups como medida de disponibilidad
  • Art. 5.1.e: Minimización – no conservar más tiempo del necesario
  • Implementación SAS:
    • Políticas de retención definidas por tipo de dato
    • Eliminación automática de backups expirados
    • Cifrado y control de acceso a backups
    • Logs de acceso a backups para auditoría

9.4. Desafíos y Proyectos Futuros

Desafíos Actuales

  • Crecimiento exponencial: 500 TB/año, insostenible a largo plazo con costes actuales
  • Protección ransomware: Necesidad de backups inmutables (air-gap, WORM)
  • Tiempos de backup: Ventanas de backup cada vez más ajustadas
  • Complejidad: Múltiples plataformas de storage dificultan gestión unificada

Iniciativas 2025-2027

  • Object Storage expansion: Migrar más datos a object storage para reducir coste (target: 50% reducción TCO)
  • Cloud tiering: Azure Blob Storage Archive tier para backups de muy largo plazo (>5 años)
  • Immutable backups: Veeam immutability + Linux hardened repository para protección ransomware
  • NVMe-oF: Reemplazo de FC SAN con NVMe over Fabrics (3x rendimiento, menor latencia)
  • Automatización: Storage-as-Code con Ansible/Terraform para aprovisionamiento automatizado

10. Preguntas de Test – 25 Preguntas

📝 Instrucciones: A continuación se presentan 25 preguntas tipo test que abarcan todo el contenido del tema. Cada pregunta tiene 4 opciones (A, B, C, D) y una única respuesta correcta. Las soluciones se encuentran al final de esta sección.

Pregunta 1: Según la normativa española, ¿cuál es el período mínimo de conservación de la historia clínica?

  • A) 1 año desde el alta del paciente
  • B) 3 años desde el alta del paciente
  • C) 5 años desde el alta de cada proceso asistencial
  • D) 10 años desde el alta del paciente

Pregunta 2: ¿Qué significa RPO (Recovery Point Objective)?

  • A) Tiempo máximo tolerable para restaurar un sistema tras un fallo
  • B) Cantidad máxima de datos que se puede permitir perder (medido en tiempo)
  • C) Número de copias de backup que deben mantenerse
  • D) Porcentaje de disponibilidad del sistema

Pregunta 3: ¿En qué consiste la regla 3-2-1 de backup?

  • A) 3 servidores, 2 data centers, 1 nube
  • B) 3 copias de datos, 2 tipos de medios diferentes, 1 copia offsite
  • C) 3 días de retención, 2 backups semanales, 1 backup mensual
  • D) 3 niveles RAID, 2 controladoras, 1 hot spare

Pregunta 4: ¿Cuál es la principal diferencia entre backup incremental y diferencial?

  • A) El incremental es más rápido de ejecutar pero más lento de recuperar
  • B) El diferencial es más rápido de ejecutar pero más lento de recuperar
  • C) El incremental solo funciona con cintas
  • D) El diferencial no permite recuperación completa

Pregunta 5: ¿Qué arquitectura de almacenamiento proporciona acceso a nivel de archivo (NFS, SMB)?

  • A) DAS (Direct Attached Storage)
  • B) NAS (Network Attached Storage)
  • C) SAN (Storage Area Network)
  • D) Object Storage

Pregunta 6: ¿Cuántos discos puede tolerar que fallen un RAID 6 antes de perder datos?

  • A) 0 discos
  • B) 1 disco
  • C) 2 discos
  • D) 3 discos

Pregunta 7: ¿Qué tipo de SSD tiene la mayor densidad de almacenamiento pero menor durabilidad?

  • A) SLC (Single-Level Cell)
  • B) MLC (Multi-Level Cell)
  • C) TLC (Triple-Level Cell)
  • D) QLC (Quad-Level Cell)

Pregunta 8: ¿Cuál es la capacidad nativa de una cinta LTO-9?

  • A) 6 TB
  • B) 12 TB
  • C) 18 TB
  • D) 36 TB

Pregunta 9: En Object Storage, ¿qué es un «bucket»?

  • A) Un tipo de disco duro especial
  • B) Un contenedor lógico que agrupa objetos
  • C) Un protocolo de red para transferir datos
  • D) Una medida de capacidad de almacenamiento

Pregunta 10: ¿Qué API se ha convertido en el estándar de facto para Object Storage?

  • A) REST genérico
  • B) Amazon S3 API
  • C) NFS versión 4
  • D) iSCSI

Pregunta 11: ¿Qué ventaja principal tiene NVMe sobre SATA para SSDs?

  • A) Mayor capacidad de almacenamiento
  • B) Menor coste por GB
  • C) Mucha menor latencia y mayor paralelismo
  • D) Mayor compatibilidad con sistemas antiguos

Pregunta 12: ¿Qué nivel de RAID NO proporciona ninguna redundancia?

  • A) RAID 0
  • B) RAID 1
  • C) RAID 5
  • D) RAID 10

Pregunta 13: En erasure coding con esquema 12+4, ¿cuántos fragmentos se necesitan como mínimo para reconstruir los datos?

  • A) 4 fragmentos
  • B) 8 fragmentos
  • C) 12 fragmentos
  • D) 16 fragmentos

Pregunta 14: ¿Qué es un snapshot en el contexto de almacenamiento?

  • A) Una fotografía del data center
  • B) Una copia instantánea point-in-time de un volumen de almacenamiento
  • C) Un tipo de backup que tarda horas en completarse
  • D) Una medida del rendimiento del disco

Pregunta 15: ¿Cuál es la principal diferencia entre replicación síncrona y asíncrona?

  • A) La síncrona es más económica
  • B) La síncrona confirma la escritura solo cuando los datos están en ambas ubicaciones (RPO=0)
  • C) La asíncrona es más rápida pero solo funciona dentro del mismo edificio
  • D) No hay diferencia práctica entre ambas

Pregunta 16: ¿Qué tecnología elimina bloques de datos duplicados en backups para ahorrar espacio?

  • A) Compresión
  • B) Deduplicación
  • C) Fragmentación
  • D) Encriptación

Pregunta 17: ¿Cuál es el overhead de capacidad (espacio perdido) de RAID 10 con 4 discos?

  • A) 25%
  • B) 33%
  • C) 50%
  • D) 75%

Pregunta 18: ¿Qué tipo de almacenamiento es más adecuado para bases de datos transaccionales críticas?

  • A) NAS con NFS
  • B) Object Storage
  • C) SAN con Fibre Channel o iSCSI
  • D) DAS con discos HDD 5400 RPM

Pregunta 19: ¿Qué significa DWPD en el contexto de SSDs enterprise?

  • A) Data Written Per Day (escrituras diarias permitidas durante la garantía)
  • B) Drive Warranty Protection Duration
  • C) Disk Write Performance Degradation
  • D) Dynamic Write Protection Device

Pregunta 20: ¿Cuál de las siguientes NO es una ventaja del Object Storage?

  • A) Escalabilidad masiva a billones de objetos
  • B) Bajo coste por TB para grandes volúmenes
  • C) Baja latencia para acceso aleatorio (como base de datos)
  • D) Durabilidad extrema mediante erasure coding

Pregunta 21: ¿Qué tecnología de almacenamiento emergente utiliza secuencias de ADN para codificar datos?

  • A) Holographic Storage
  • B) DNA Storage
  • C) Phase-Change Memory (PCM)
  • D) MRAM

Pregunta 22: En el contexto del SAS, ¿qué sistema se utiliza para almacenamiento de imágenes médicas (PACS)?

  • A) DAS con discos locales
  • B) Object Storage (Dell EMC ECS)
  • C) Cintas LTO directamente
  • D) USB drives externos

Pregunta 23: ¿Qué control del ENS especifica requisitos de copias de respaldo?

  • A) mp.com.1
  • B) op.exp.2
  • C) org.2
  • D) mp.si.3

Pregunta 24: ¿Cuál es la vida útil típica de una cinta magnética LTO en condiciones óptimas de almacenamiento?

  • A) 5 años
  • B) 10 años
  • C) 30 años
  • D) 100 años

Pregunta 25: ¿Qué significa WORM en el contexto de almacenamiento?

  • A) Write Once Read Many (escribir una vez, leer muchas veces)
  • B) Wide Object Replication Method
  • C) Workload Optimization and Resource Management
  • D) Wireless Optical Reading Module

✅ SOLUCIONES DE LAS PREGUNTAS DE TEST

📊 Respuestas Correctas con Explicaciones Detalladas

Pregunta Respuesta Explicación
1 C La Ley 41/2002 establece un mínimo de 5 años desde el alta de cada proceso asistencial. En la práctica, el SAS conserva historias clínicas indefinidamente por su valor asistencial, investigador y legal. Orden andaluza 21/12/2015 especifica conservación permanente.
2 B RPO (Recovery Point Objective) es la cantidad máxima de datos que la organización puede permitirse perder, medido en tiempo. Por ejemplo, RPO de 4 horas significa backups cada 4 horas máximo. RTO es el tiempo de restauración.
3 B La regla 3-2-1 establece: 3 copias totales de datos (original + 2 backups), en 2 tipos de medios diferentes (ej: disco + tape), con 1 copia offsite (geográficamente separada). Es el estándar de oro para backup efectivo.
4 A El backup incremental copia solo cambios desde último backup (incremental o full), es rápido de ejecutar pero lento de recuperar (necesita full + todos los incrementales). El diferencial copia cambios desde último full, más lento de ejecutar pero más rápido de recuperar (solo full + último diferencial).
5 B NAS (Network Attached Storage) proporciona almacenamiento a nivel de archivo mediante protocolos NFS (Unix/Linux), SMB/CIFS (Windows) o AFP (macOS). DAS y SAN proporcionan acceso a nivel de bloque. Object Storage usa API REST (HTTP).
6 C RAID 6 utiliza doble paridad (P y Q) que permite tolerar el fallo simultáneo de 2 discos sin pérdida de datos. RAID 5 solo tolera 1 disco. RAID 6 es esencial con discos grandes (>2TB) donde el riesgo de fallo durante rebuild es significativo.
7 D QLC (Quad-Level Cell) almacena 4 bits por celda, máxima densidad y menor coste por GB, pero menor rendimiento y durabilidad que TLC (3 bits), MLC (2 bits) o SLC (1 bit). QLC es ideal para read-intensive workloads y cold storage.
8 C LTO-9 (Linear Tape-Open generación 9) tiene capacidad nativa de 18 TB, que se extiende a 45 TB con compresión 2.5:1 típica. LTO-8 era 12 TB nativo. LTO-10 (roadmap 2026) será 36 TB nativo.
9 B En Object Storage, un bucket es un contenedor lógico que agrupa objetos. Es el nivel más alto de organización, similar a un volumen o carpeta raíz, pero sin jerarquía interna (espacio de nombres plano). Buckets tienen nombres globalmente únicos.
10 B Amazon S3 API se ha convertido en el estándar de facto para Object Storage. Prácticamente todos los proveedores (MinIO, Dell EMC ECS, NetApp StorageGRID, Azure Blob con compatibilidad S3) soportan S3 API, garantizando portabilidad entre plataformas.
11 C NVMe (Non-Volatile Memory Express) utiliza bus PCIe en lugar de SATA, proporcionando latencias de ~10 µs (vs ~100 µs de SATA SSD) y soportando 64K colas de comandos (vs 32 de SATA), permitiendo paralelización masiva. Resultado: 10-20x más IOPS y throughput.
12 A RAID 0 (striping) distribuye datos en bloques entre discos para máximo rendimiento pero sin redundancia. El fallo de cualquier disco causa pérdida total de datos. RAID 0 solo debe usarse para datos temporales no críticos, nunca en producción.
13 C En erasure coding K+M, se necesitan K fragmentos cualesquiera de los K+M totales para reconstruir los datos originales. En esquema 12+4: 12 fragmentos de datos + 4 de paridad = tolera pérdida de 4 fragmentos, necesita mínimo 12 para reconstruir.
14 B Un snapshot es una copia instantánea point-in-time del estado de un volumen de almacenamiento, creada en segundos mediante técnicas copy-on-write o redirect-on-write. Permite recuperación rápida a estados anteriores pero NO es backup (mismo storage físico).
15 B Replicación síncrona confirma escritura solo cuando datos están en ambas ubicaciones (RPO=0, sin pérdida de datos), pero añade latencia. Asíncrona confirma localmente y replica en background (RPO > 0), sin impacto en latencia pero posible pérdida en ventana de replicación.
16 B Deduplicación identifica y elimina bloques de datos duplicados, almacenando solo una copia única con referencias. Típicamente logra ratios 10:1 a 50:1 en entornos virtualizados. Compresión es diferente (reduce tamaño individual de archivos, no elimina duplicados).
17 C RAID 10 (espejo + stripe) utiliza 50% de capacidad bruta siempre. Con 4 discos de 1TB cada uno = 4TB brutos, capacidad útil 2TB (50% overhead). La mitad se usa para espejos (mirrors), independientemente del número de discos.
18 C Bases de datos transaccionales críticas requieren baja latencia y alto IOPS que solo proporciona SAN a nivel de bloque con Fibre Channel o iSCSI. NAS tiene overhead de protocolos de archivo. Object Storage tiene alta latencia. DAS no es compartible entre servidores (no HA).
19 A DWPD (Drive Writes Per Day) indica cuántas veces se puede escribir la capacidad completa del SSD diariamente durante el período de garantía (típicamente 5 años). DWPD de 3 en SSD de 1TB = 3TB/día × 365 días × 5 años = 5.475 PB escrituras totales garantizadas.
20 C Object Storage NO es adecuado para acceso aleatorio de baja latencia (bases de datos transaccionales). Tiene latencias de ms a segundos (API HTTP/REST). Sus fortalezas son: escalabilidad masiva, bajo coste, durabilidad extrema, ideal para datos no estructurados y archivos grandes.
21 B DNA Storage codifica datos digitales en secuencias de ADN sintético. Densidad teórica de 215 PB/gramo, durabilidad de miles de años. En investigación (Microsoft, Twist Bioscience), desafíos: coste prohibitivo ($1000/MB) y velocidad. Futuro: archivo ultra-largo plazo.
22 B El SAS utiliza Dell EMC ECS Object Storage para almacenamiento de imágenes DICOM (PACS/RIS). Capacidad de 2 PB con crecimiento de 300 TB/año. Beneficios: escalabilidad masiva, coste-eficiencia, durabilidad con erasure coding, API S3 para integración con PACS vendors.
23 B El control op.exp.2 del Esquema Nacional de Seguridad especifica los requisitos de copias de respaldo (backup): frecuencia según criticidad, verificación periódica, protección física y lógica, y pruebas de restauración. Fundamental para categoría ALTA en sistemas sanitarios.
24 C Las cintas magnéticas LTO tienen vida útil de aproximadamente 30 años en condiciones óptimas de almacenamiento (temperatura 16-25°C, humedad 20-50%). Esto las hace ideales para archivo de largo plazo y cumplimiento normativo. HDD/SSD típicamente 3-5 años.
25 A WORM (Write Once Read Many) es un modelo de almacenamiento inmutable donde los datos una vez escritos no pueden ser modificados ni eliminados durante un período definido. Crítico para cumplimiento normativo (SEC, HIPAA, RGPD) y protección contra ransomware.

📈 Evaluación del Resultado

  • 23-25 correctas (92-100%): Excelente dominio del tema. Preparación óptima en conservación y almacenamiento.
  • 20-22 correctas (80-88%): Buen conocimiento. Revisar áreas específicas con errores (RAID, Object Storage, normativa).
  • 17-19 correctas (68-76%): Conocimiento aceptable. Reforzar conceptos de redundancia y nuevas tecnologías.
  • Menos de 17 correctas (<68%): Recomendado repasar el tema completo, especialmente políticas de backup y tipos de storage.

💡 Consejos para el Examen

  • Conceptos clave: Dominar diferencias entre DAS/NAS/SAN, RAID 0/1/5/6/10, RPO vs RTO, incremental vs diferencial
  • Normativa: Conocer períodos de retención (historias clínicas 5 años mínimo), ENS control op.exp.2, RGPD minimización
  • Números importantes: RAID 6 = 2 discos fallo, LTO-9 = 18 TB, regla 3-2-1, vida útil tape = 30 años
  • Tecnologías SAS: NetApp/HPE 3PAR (primary), Dell EMC ECS (PACS), Veeam (backup), LTO-9 (tape)
  • Object Storage: S3 API estándar, escalabilidad masiva, metadatos ricos, erasure coding, casos de uso (PACS, archivo)
  • Nuevas tecnologías: DNA storage (densidad extrema), NVMe (baja latencia), QLC (capacidad económica)

11. Referencias Bibliográficas

Normativa y Estándares

  • Ley 41/2002, de 14 de noviembre, básica reguladora de la autonomía del paciente
  • Orden de 21 de diciembre de 2015, de la Consejería de Salud de Andalucía sobre documentación clínica
  • Reglamento (UE) 2016/679 – RGPD
  • Real Decreto 311/2022 – Esquema Nacional de Seguridad (ENS)
  • CCN-STIC 812: Seguridad en entornos y aplicaciones Web
  • ISO 11799:2015 – Information and documentation — Document storage requirements for archive and library materials

Libros Técnicos

  • Preston, W.C. (2017). Modern Data Protection. O’Reilly Media. ISBN: 978-1491935873
  • Little, R. & Chapa, D. (2017). Cisco Data Center Fundamentals. Cisco Press. ISBN: 978-1587144776
  • Troppens, U., Erkens, R., & Müller-Friedt, W. (2009). Storage Networks Explained. Wiley. ISBN: 978-0470741498
  • Poelker, C. & Nikitin, A. (2017). Storage Area Networks For Dummies (2nd Edition). Wiley. ISBN: 978-1119079415

Documentación de Fabricantes

  • NetApp (2024). ONTAP 9 Documentation. https://docs.netapp.com/
  • Dell Technologies (2024). Dell EMC ECS Documentation. https://www.dell.com/support/
  • Veeam (2024). Veeam Backup & Replication v12 User Guide. https://helpcenter.veeam.com/
  • LTO Consortium (2024). LTO Technology. https://www.lto.org/
  • SNIA (2024). Object Storage Architecture Guide. https://www.snia.org/

White Papers y Recursos Técnicos

  • Gartner (2024). Magic Quadrant for Primary Storage Arrays
  • IDC (2024). Worldwide Enterprise Storage Systems Tracker
  • AWS (2024). Amazon S3 Best Practices Design Patterns. https://aws.amazon.com/s3/
  • Backblaze (2024). Hard Drive Stats. https://www.backblaze.com/b2/hard-drive-test-data.html

Artículos Científicos

  • Church, G.M. et al. (2012). «Next-Generation Digital Information Storage in DNA». Science, 337(6102), 1628
  • Patterson, D.A., Gibson, G., & Katz, R.H. (1988). «A case for redundant arrays of inexpensive disks (RAID)». ACM SIGMOD

Documento actualizado: Octubre 2025

Fuente: Material preparado para oposiciones del Servicio Andaluz de Salud (SAS)

Tema: 58 – Conservación de Información y Tecnologías de Almacenamiento

OPE 2025: Técnico/a de Función Administrativa – Informática

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *