Tenemos ante nosotros la oportunidad de redimensionar el papel de la información electrónica, buscando construir una memoria colectiva que extienda nuestras capacidades para preservar, transmitir e, incluso, generar conocimiento.
En los últimos años los sistemas de almacenamiento distribuido (SAD) han sido objeto de un gran interés por parte de las empresas y los grupos de investigación en el área [mclinton, gray]. Aun cuando la función básica de estos sistemas consiste en repartir archivos sobre un conjunto de dispositivos de almacenamiento conectados en red, se reconoce también que un diseño cuidadoso puede producir funcionalidades mejoradas y atributos de calidad superiores, particularmente aquellos relacionados con la integridad, confidencialidad y disponibilidad de la información. Un sistema de este tipo se convierte en una opción muy atractiva para la gestión de un volumen de información que puede crecer con el tiempo y alcanzar escalas masivas.
La comunidad de investigación en el tema del almacenamiento distribuido, ha denominado “silos de datos” a aquellos sistemas orientados a la gestión de colecciones documentales, normalmente pensadas para el uso de una organización, cuyo volumen excede las capacidades de las herramientas convencionales, empleadas para su almacenamiento, gestión y análisis. Cabe reflexionar que la frontera entre lo que es o no “convencional”, se está moviendo en la misma medida en que la tecnología se abarata y ofrece dispositivos que hasta hace poco se consideraban fuera del alcance del gran público.
Nuestra aportación: Babel
El sistema de archivos Babel es un sistema de almacenamiento masivo, o silo de datos, desarrollado en INFOTEC. Toma su nombre del famoso cuento de Borges, “La biblioteca de Babel”. Se compone de un conjunto de máquinas con capacidades de almacenamiento y procesamiento, llamadas nodos, que se conectan mediante una red local formando un clúster. Los clientes de Babel se comunican con una sola máquina, denominada coordinador o proxy, que despacha las solicitudes de servicio (almacenamiento, búsqueda y recuperación de archivos) y administra los recursos. Por otro lado, los archivos se guardan de manera redundante. Esto quiere decir que se crea un exceso en la información que codifica a los archivos y este exceso se guarda de forma distribuida entre los diferentes dispositivos que componen al sistema.
El beneficio inmediato del almacenamiento distribuido es que se logra la independencia entre la información y el medio en que se aloja. Visto de otra forma, los archivos que se guardan en un repositorio colectivo no dependen de un solo dispositivo para su recuperación. Si un documento estuviera guardado en una sola máquina, entonces la falla de ésta cancelaría la recuperación del mismo. En tanto, el exceso de información constituye una forma de “respaldo” que ofrece garantías de tolerancia a fallas y mejora la disponibilidad del sistema.
Algunas de las características sobresalientes de Babel son:
1.Puede percibirse como un disco virtual con capacidad ilimitada, al que puede accederse vía web y está en servicio de manera continua para todo tipo de aplicación.
2.Permite almacenar y recuperar con agilidad archivos de cualquier tipo garantizando su integridad y disponibilidad.
3.Incorpora mecanismos de seguridad para autenticar el acceso de los usuarios.
4.Puede crecer de acuerdo con las necesidades de su aplicación, para lo cual dispone de mecanismos de rebalanceo automático de carga.
5.Puede configurarse el número de fallas en los medios de almacenamiento, sin perjuicio de los servicios que soporta.
6.Puede implementarse con equipos de bajo costo o con equipos de altas prestaciones.
7.Cuenta con una interfaz gráfica de gestión y configuración para administrar los recursos.
Conclusiones
El modelo de almacenamiento detrás de este desarrollo, es una tecnología emergente propuesta para tomar ventaja de la infraestructura existente de Internet y ofrecer cómputo de altas prestaciones a bajo costo, mientras se centraliza el control y manejo de recursos distribuidos mediante el uso de sistemas de virtualización. Con ello se espera hacer frente a los retos antes mencionados y mejorar la competitividad de las organizaciones.
En el sector público existen muchas entidades que podrían beneficiarse de este desarrollo: los centros de investigación, las secretarías de estado, el poder judicial o el poder legislativo. Incluso, los gobiernos estatales o municipales tendrían la posibilidad de reorganizar su capacidad instalada y aprovecharla de manera más eficiente.
Tenemos ante nosotros la oportunidad de redimensionar el papel de la información electrónica, buscando construir una memoria colectiva que extienda nuestras capacidades para preservar, transmitir e, incluso, generar conocimiento.
Referencias
D. McClinton, et. al. “10 emerging technologies that will change your world”;Technology
Review, 31-50, 2004.
J. Gray. “What’s next? A dozen information-technology research goals”;Journal of the ACM, 40:41-57, 2003.
J. Manyika, et al. “Big data: The next frontier for innovation, competition, and productivity”,
The McKinsey Global Institute, Technical Report, May 2011.