Almacenamiento
Sistemas de archivos en Windows Server 2022
1. Introducción
Hay tres sistemas de archivos utilizados en Windows Server 2022, exFAT, NTFS y ReFS. No hablaremos del sistema de archivos exFAT en este libro, porque no se usa con frecuencia, así que nos concentraremos en NTFS y ReFS.
Mientras que NTFS es bien conocido y se utiliza en los sistemas Windows desde 1993, ReFS está presente en Windows Server desde la versión 2012, pero es menos conocido por el gran público. ReFS se desarrolló a partir de NTFS y comparte con este último, el sistema de árbol que comienza en la raíz de un volumen. Realmente no se puede decir que uno sea mejor que el otro, ya que los casos de uso son muy diferentes. Mientras que algunas características de Windows Server sólo se pueden utilizar con el sistema NTFS, como el rol de servidor DFS, otras aprovechan al máximo las nuevas características de ReFS.
Aunque más antiguo, NTFS conserva algunas características únicas, como cuotas de disco, volúmenes bootables (Windows no puede arrancar desde un volumen ReFS), hard links, cifrado EFS y otras de las que carece ReFS. Por tanto, ReFS no se puede considerar un sistema de archivos que vaya a sustituir a NTFS, sino más bien un sistema de archivos diseñado para cumplir otras funciones.
ReFS ofrece una mejor gestión de la corrupción de datos, mayor rendimiento en términos de velocidad, gestión de volúmenes muy grandes y mejor deduplicación de datos. Todas estas características lo convierten en el sistema de archivos preferido para almacenar datos masivos, discos de máquinas virtuales, donde mejora el rendimiento o espacios de almacenamiento.
Por tanto, no existe competencia entre ambos sistemas de archivos, ya que ambos cumplen funciones diferentes dentro de Windows Server. Sin embargo, hay que tener en cuenta que ReFS es un sistema de archivos que tiene fama de consumir muchos recursos y de exigir mucho más al hardware...
El trabajo práctico
El trabajo práctico de este capítulo consta de tres servidores:
-
un controlador de dominio DC-cole para el dominio cole.com,
-
un servidor STOCK1, que estará en el dominio,
-
un servidor STOCK2, que no será miembro de la red,
-
una máquina cliente Windows 10 que estará en el dominio.
En nuestro trabajo práctico, los servidores STOCK1 y STOCK2 tienen el controlador de dominio como servidor DNS en su configuración de red.
Grupos de almacenamiento y espacios de almacenamiento
1. Conceptos básicos
Un pool de almacenamiento es una agrupación lógica de varios discos físicos. Se pueden agrupar discos de diferentes tipos - SSD sata, NVMe, HDD - en un mismo pool de almacenamiento. Una vez reunidos los discos en un mismo pool, se pueden crear uno o varios discos virtuales. Estos discos virtuales se denominan espacio de almacenamiento en la terminología de Windows Server. Estos discos virtuales se pueden formatear en NTFS o ReFS para crear uno o varios volúmenes. Se puede acceder a los volúmenes creados de este modo a través del explorador de archivos. Un pool de almacenamiento puede contener uno o más espacios de almacenamiento. Los discos virtuales no son discos de máquinas virtuales Hyper-V, sino entidades vistas por el sistema como discos.
Se pueden implementar los mismos tipos de redundancia que con los sistemas raid tradicionales, agregados por banda, paridad y espejo. Además, estos sistemas no requieren un controlador raid físico.
Reunir los discos en conjuntos lógicos y hacerlos funcionar mediante discos virtuales aporta toda la flexibilidad del software y nuevas funciones. Es lo que se conoce como virtualización del almacenamiento:
-
Esto permite el aprovisionamiento dinámico, en el que el disco virtual ocupa sólo el espacio necesario en los discos físicos y crece en función de las necesidades hasta alcanzar su tamaño máximo.
-
Esto también permite los niveles de almacenamiento (tiering), en los que el sistema coloca los archivos que se utilizan con más frecuencia en los discos físicos más rápidos y los archivos que se utilizan con menos frecuencia en los discos más lentos.
-
El sistema creará una caché de escritura en los discos más rápidos, para poder escribir más rápido y posteriormente, distribuirá los datos a los distintos niveles de almacenamiento potencialmente más lentos.
-
Es posible mezclar discos virtuales que explotan diferentes tipos de redundancia en el mismo espacio de almacenamiento. Así, si el número de discos físicos lo permite, es perfectamente posible crear un volumen agregado por bandas para los datos que requieren un buen rendimiento y un volumen espejo para la tolerancia a fallos...
Uso compartido avanzado
Windows Server ofrece funciones avanzadas para la gestión de recursos compartidos. Aprovecha la versión 3 del protocolo SMB, el protocolo utilizado por Windows para los recursos compartidos y puede crear recursos compartidos NFS compatibles con Linux y Unix.
1. Gestión del protocolo SMB
La versión 1 del protocolo SMB no está instalada por defecto en Windows Server 2019 y 2022. Representa una vulnerabilidad de seguridad y ya no cumple con los estándares actuales. Sin embargo, se puede activar manualmente por motivos de compatibilidad con versiones anteriores. También es posible supervisar los accesos SMB 1. Recomendamos dejar SMB 1 desactivado.
a. Supervisión SMB 1
Utilice el siguiente comando de PowerShell para ver la configuración del protocolo SMB:
Get-SmbServerConfiguration
El resultado del comando proporciona una serie de parámetros. La línea EnableSMB1Protocol indica si la versión está activada o no. La línea justo debajo se refiere a la versión 2 del protocolo.
También es posible activar la supervisión de los intentos de conexión a través del protocolo SMB 1. Para ello, utilice el comando PowerShell:
Set-SmbServerConfiguration -AuditSmb1Access $true
Esto permitirá que los intentos de acceder al servidor utilizando el protocolo SMB 1 se registren en los registros de eventos.
Estos eventos de información se pueden encontrar en Microsoft - Windows logs - Applications and Services Logs - Windows - SMB server - audit. Busque eventos con el número de ID 3000.
La descripción del evento incluye la fecha de conexión y la dirección IP del cliente.
b. Activación y desactivación del protocolo SMB
Si, por razones de compatibilidad con versiones anteriores, está obligado a utilizar SMB 1, deberá instalar la funcionalidad con el administrador de servidores.
Será necesario añadir funciones y roles al gestor de servidores.
A continuación, instale el servidor SMB 1 en las características.

A continuación, actívelo mediante PowerShell:
Set-SmbServerConfiguration -EnableSMB1Protocol $true
Si se ha activado SMB 1 y desea desactivarlo, introduzca el comando:
Set-SmbServerConfiguration -EnableSMB2Protocol $true
Los mismos comandos...
File Server Resource Manager (FSRM)
En la sección anterior de este capítulo, para poder realizar la compartición avanzada, instalamos el servicio de rol de servidor de archivos y almacenamiento File Server Resource Manager.
La instalación de este servicio de rol da acceso a una consola del mismo nombre, que se puede encontrar en start/windows administration tools y que se puede utilizar para configurar el servidor de archivos.
Desde esta consola configuraremos las opciones del servidor. Podremos crear cuotas personalizadas, prohibir determinados tipos de archivos como .mp3 o .iso, gestionar la clasificación de datos y automatizar determinadas tareas de gestión de datos.
1. Configuración básica del servidor de archivos
En la consola, haga clic con el botón derecho en el servidor y seleccione Configure Options en el menú desplegable.
Se abre una ventana con varias pestañas dedicadas a la configuración del servidor de archivos.

a. Configuración del servidor de correo electrónico
Al crear recursos compartidos avanzados, vimos que era posible definir una dirección de correo electrónico para avisar a los administradores cuando se superan determinadas cuotas de datos. Por supuesto, esto sólo funciona si el servidor de archivos sabe dónde unirse al servidor de correo.
Vaya a la pestaña Email Notifications, introduzca la dirección del servidor de correo electrónico, la dirección de correo electrónico de los administradores con los que se debe poner en contacto y la dirección de correo electrónico...
Deduplicación de datos
1. Conceptos básicos
La deduplicación de datos es una técnica que consiste en almacenar flujos de datos binarios idénticos una sola vez, y anotar sus ubicaciones en un archivo de referencia.
Por ejemplo, si tomamos varios documentos de Word de la misma empresa, tendrán partes idénticas, como los metadatos de Word, las cabeceras del documento o el logotipo de la empresa. Por tanto, todos estos documentos tendrán secuencias de datos binarios idénticas.
El sistema identificará estas secuencias binarias idénticas y dividirá los archivos en consecuencia, en bloques de tamaño variable. Estos bloques sólo se almacenarán físicamente una vez en el disco, en un repositorio y se podrán comprimir.

Su ubicación en los archivos originales se sustituirá por puntos de análisis y se anotará en un archivo de referencia.

La deduplicación tiene lugar después de la escritura de los datos. Los datos se escriben en el disco de la forma convencional y luego se deduplican. Por tanto, el rendimiento de escritura del sistema no se ve afectado.
En la lectura, el sistema leerá los puntos de referencia de los archivos y recuperará los bloques correspondientes. La parte útil de un documento, excluidos los metadatos, se denomina "flujo de archivos" en la jerga de la deduplicación.
La deduplicación puede ahorrar hasta un 95% de espacio en disco, dependiendo del tipo de archivo:
-
Archivos de Microsoft Office: 30 - 50%. Cuando se configura para este tipo de archivos, la deduplicación tiene lugar en segundo plano.
-
Archivos ISO, discos duros de máquinas virtuales, VDI: 80 - 95%. La deduplicación de este tipo de archivos también se realiza en segundo plano.
-
Archivos de despliegue .msi .cab, binarios de software: 70 - 80%. Este tipo de deduplicación tendrá lugar según un ajuste de prioridades.
También hay que señalar que la deduplicación es especialmente eficaz con el sistema de archivos ReFS.
La deduplicación implica varias fases que se pueden programar en el tiempo y corresponden a las tareas realizadas por el servicio de deduplicación:
-
Optimización: aquí es donde tiene lugar la deduplicación real, el sistema cortará los archivos en bloques, los almacenará...
Réplica de almacenamiento
1. Presentación de réplicas de almacenamiento
La réplica de almacenamiento es una herramienta para replicar volúmenes entre servidores o clústers de servidores. Permite la replicación síncrona y asíncrona. Su objetivo es implementar una solución de recuperación de emergencia y un plan de recuperación de desastres. Las réplicas de almacenamiento requieren la implementación de Active Directory.
La replicación utiliza el protocolo SMB3 y puede utilizar compresión de datos en la versión Datacenter Azure Edition de Windows Server 2022. Los intercambios entre servidores están cifrados y los nodos de replicación utilizan autenticación Kerberos.
-
La replicación síncrona tiene lugar en tiempo real y está diseñada para funcionar en entornos de red de baja latencia, dentro del mismo edificio o en la misma ciudad. No garantiza ninguna pérdida de datos. La latencia de red máxima admitida para la replicación síncrona es de 5 ms. También requiere conjuntos de almacenamiento con un buen rendimiento de lectura/escritura ya que, si la replicación síncrona está activada, el trabajo de escritura no se considerará completo hasta que los datos se hayan escrito en ambos discos. La replicación sincrónica es la replicación por defecto.
-
La replicación asíncrona, en cambio, está diseñada para funcionar entre dos sitios físicos remotos con una conexión de alta latencia y no garantiza que no haya pérdida de datos en caso de desastre. La latencia no se tiene en cuenta en la replicación asíncrona.
Una réplica de almacenamiento implementa la replicación a nivel de bloque y permite replicar los archivos que están en uso. Antes de las réplicas de almacenamiento, muchas empresas utilizaban DFS para replicar archivos entre dos sitios remotos, pero DFS gestiona la replicación a nivel de archivo, lo que no permite replicar los datos en uso. Esto significaba que los datos de uso frecuente no se replicaban correctamente.
El almacenamiento de réplica se puede utilizar con una amplia variedad de soluciones de almacenamiento, incluidos discos locales, armarios JBOD y almacenamiento SAN.
Para implementar la replicación...
Distributed File System (DFS)
1. Introducción a DFS
DFS es una característica de Windows Server que consta de dos servicios de rol File and Storage Services y permite agrupar varios recursos compartidos ubicados en diferentes servidores bajo una única dirección, denominada espacio de nombres y garantizar la replicación entre las carpetas compartidas.
El servicio de función DFS Spacename permite agrupar carpetas y DFS Replication garantiza la replicación. Es posible instalar únicamente el servicio de espacio de nombres; la replicación no es obligatoria.
DFS sabe trabajar con Active Directory y se puede configurar para tener en cuenta los sitios de Active Directory, a la hora de gestionar la replicación. La replicación DFS es una replicación a nivel de archivos que no permite replicar archivos en uso.
DFS requiere volúmenes formateados con el sistema de archivos NTFS.
Es posible desplegar estos servicios de rol de varias maneras, pero recomendamos instalar el servicio de espacio de nombres en un controlador de dominio. De este modo, sólo gestionará los espacios de nombres y la replicación DFS se instalará en los servidores que contengan las carpetas compartidas, si decide replicarlas.
También es posible utilizar DFS sin Active Directory, en cuyo caso hablamos de espacios de nombres autónomos. Esta es la solución preferida si su empresa no utiliza Active Directory. Sin embargo, la replicación no será posible, ya que requiere Active Directory para funcionar.
La replicación se puede configurar sin utilizar un espacio de nombres. Las carpetas compartidas se replicarán, pero no se combinarán en un espacio de nombres ni tendrán una dirección única.
DFS es una función muy utilizada en las empresas y es una buena idea tener una base sólida en ella.
2. Principios de funcionamiento
a. Principios básicos
El servidor de espacios de nombres puede alojar varios espacios de nombres. Cada espacio de nombres comienza con una raíz, que es una dirección de red como "\cole.com\reports". Se puede considerar esta raíz como el propio espacio de nombres.
En esta raíz se pueden crear carpetas. Imaginemos que el espacio de nombres contiene informes de varias áreas de la empresa: personal comercial, técnicos...
Almacenamiento iSCSI
1. Introducción a iSCSI
iSCSI (Internet Small Computer System Interface) es una tecnología que permite conectar máquinas al almacenamiento, a través de la red IP. Es lo que se conoce como Storage Area Network o SAN, en la que los servidores pueden utilizar almacenamiento situado en otra parte de la red de la empresa o en una red remota a través de iSCSI. iSCSI es una tecnología de almacenamiento block level.
Las máquinas que se conectan al almacenamiento iSCSI utilizan iniciadores para acceder a los volúmenes y las máquinas que contienen almacenamiento iSCSI, utilizan destinos para hacer accesibles los volúmenes (target). Un volumen iSCSI se denomina LUN (Logical Unit Number).
Las máquinas que utilizan iSCSI necesitan un adaptador de red, que puede ser hardware en forma de tarjeta PCI que se añade a la máquina o un componente de software que simula una tarjeta de este tipo.
iSCSI encapsula los comandos iSCSI en paquetes TCP/IP estándar, lo que permite utilizar redes tradicionales para operar el almacenamiento iSCSI.
Para establecer una conexión iSCSI, el iniciador debe descubrir los destinos y, a continuación, establecer una sesión de comunicación con ellos. Una vez hecho esto, se pueden transmitir datos, tanto de lectura como de escritura. Los destinos y los iniciadores tienen un identificador único, el IQN (iSCSI Qualified Name), que se utiliza para establecer sesiones e identificarse.
Como el almacenamiento está en otro lugar de la red, varias máquinas pueden utilizarlo al mismo tiempo. Este es uno de los principios básicos de la agrupación en clústeres, en la que varias máquinas se reúnen en una sola entidad y utilizan un almacenamiento compartido que se encuentra a distancia en la red.
Existen otras tecnologías para el almacenamiento SAN, como el canal Fibre Channel o Fibre Channel over Ethernet (FCoE), pero requieren...