Dividiendo los archivos en clúster, así nacieron los sectores y los clústeres

En la columna anterior comenzamos a desentrañar los discos magnéticos de nuestros ordenadores y vimos cómo estos archivos se pueden dividir en pistas, que a su vez, estas están constituidas por sectores.

Pero después estos sectores se agruparon en clústeres debido a la necesidad de guardar archivos de más tamaño, conoce como nacieron los sectores y porque la necesidad dio paso a la aparición de los clúster.

Los primeros discos duros destinados a equipar a los ordenadores personales fueron puestos a disposición hace un poco más de treinta años y tenían una capacidad de sólo cinco Megabytes. En esos días el término “multimedia” no se había integrado todavía en el vocabulario de los usuarios. Así que no había ningún archivo de vídeo, música e imagen. Solo figuraban principalmente los que contenían código de texto o archivo ejecutable y eran pequeños.

Por esto, cuando se concluyó que sería mejor administrarlos dejándolos en “pedazos”, se consideró que era suficiente dividirlos en fragmentos de 512 bytes. Y esto fue hecho trazando en las superficies magnéticas de los discos duros, líneas imaginarias diametrales que formaban sectores, y que estos, a su vez, dividían los sectores en un conjunto de circunferencia de arcos donde cabían 512 bytes en cada una.

cluster

(A) Pista (B) Sector geométrico (C) Sector de disco (D) Clúster

 

Así nacieron los sectores

Fue de este modo, como nacieron los sectores. Cuyo nombre es claramente incorrecto, puesto que, desde un punto de vista de la geometría, un sector, es una figura plana con el forma de un pedazo de pizza, mientras que para un técnico en informática, un sector es una línea, que tiene la forma de un arco de circunferencia. Pero para la “pandilla” de informática nunca se le ha dado muy bien, el respetar la nomenclatura de otras ciencias.

Pero, al dividir todas las pistas en un número igual de sectores, las pistas que están más cerca del centra (los arcos de circunferencia más pequeñas) se quedan más cortos, que de los que están cerca del borde. En un esquema como este, grabar bytes por sector implica desperdiciar espacio en los sectores más largos, cuya densidad de datos (número de bytes grabados por unidad de longitud) es mucho menor.

Este fue el primer problema en resolverse, cuando se vio la necesidad de aumentar la capacidad del disco duro magnético. Y la solución, fue optimizar la utilización del espacio físico en las pistas externas. Para esto, se determinó que la máxima densidad de catos compatibles con un almacenamiento seguro, era dividir las pistas internas de forma que sus sectores mantuviesen esta densidad al almacenar los bytes. A continuación, se comprobó cuál era la longitud de estos sectores y se subdividió las demás pistas en arcos de circunferencia de este largo. Con esto todas las pistas se dividen en sectores de igual longitud, lo que permitió mantener la misma densidad de datos para grabar sus 512 bytes y se elimina el desperdicio, aumentando la capacidad de grabación en cada cara.

Pero es fácil darse cuenta de lo esto significa, las pistas exteriores han recibido un mayor número de sectores que las internos. Si resuelve un problema, termina creando otro, ya administrar la distribución de datos en rutas de desigual número de sectores sería una pesadilla. Pero este tipo de problema, el ordenador resuelven fácilmente, solo basto con mapear los sectores de tal forma que, aunque físicamente estén distribuidos de forma desigual por las pistas, desde un punto de vista lógico todo se comportaba como si la división fuese análoga a la mostrada en la imagen de más arriba. En resumen, aunque este compuesto de pistas de diferentes números de sectores, el disco simula (emula) continuar manteniendo una distribución homogénea de las pistas por sector, como la imagen de arriba.

Esto es realizado usando un circuito en la propia controladora del disco que es consultada por el sistema operativo cada vez que necesita acceder al disco duro. El sistema operativo solicita los datos que hay en el sector x de la pista y de la cara z, el controlador consulta el circuito, y descubre donde está el sector en el disco duro, lee los datos y los envió al sistema operativo como si estuviesen en el sector, pista y cara solicitada.

Y si crees que esto del “mapeo de sectores” es complicado, olvídalo. Sólo tienes que tener en cuenta que cuando el sistema operativo solicita que 512 bytes sean escritos en, digamos por ejemplo, el segundo sector de la tercera vía de la cuarta cara de una unidad de disco magnético, para solicitar la lectura de la misma pista y la misma cara, y recibir de vuelta los mismos 512 bytes, no importa donde, efectivamente, han sido registrados. Lo que importa es que se almacena y se recupera sin daño.

Así nacieron los clúster

Pero la capacidad de los discos duros siguió aumentando, y luego aparecieron los contenidos multimedia, con sus archivos desmesuradamente grandes, y se llegó a un punto en que la subdivisión en sectores de apenas 512 bytes hacía imposible administrarlos.

La solución era obvia, aumentar la capacidad del sector. Pero, las tantas rutinas de programación y los sistemas de administración dependían del hecho de que un sector debía tener exactos los 512 bytes que cambiar este número sería imposible. De modo que así, hasta el día de hoy el número mágico es el mismo.

La solución, disminuir el número de “pedazos” en que se subdivide un archivo, haciendo con que cada uno de ellos contenga ya no un único, sino un grupo de sectores.

Estos grupos de sectores fueron bautizados con el nombre de “clúster”. Y en vez de grabar un sector cada vez, se pasó a grabar un clúster cada vez y gestionar los archivos en las pistas en forma de un conjunto de clúster, ya no más en sectores (aunque, por supuesto, en cada sistema un clúster contiene un número fijo de sectores).

Lo que ha dado un gran procedimiento de flexibilidad, ya que está diseñado de tal manera que se puede variar el número de sectores contenidos en un clúster sin cambiar la forma en que se realiza la gestión. Por lo tanto, diferentes sistemas de archivos pueden usar grupos con diferente número de sectores y coexistir pacíficamente.

En resumen, para grabar un archivo en un disco solo basta con subdividirlo en clúster y distribuir los clúster por las diversas caras de la unidad de disco duro magnético. Dado que, en la práctica, sean cuales sean los accesos al disco se hacen a los distintos sectores o sectores agrupados en clúster, los archivos se continuaron registrando y recuperado sin problemas.