Gestión Autonómica de Energía y Fallos en Clústeres de Computadores
Author:
Publication date:
Serie:
Máster Universitario en Ingeniería Informática
Abstract:
El consumo de energía de grandes clústeres de ordenadores afecta a los costes de explotación de centros de datos, en particular incrementando el coste total de posesión (TCO). Por lo tanto, la utilización de algoritmos de minimización de la energía es esencial para una explotación rentable de los centros de datos. El gestor energético presentado en este trabajo se basa en un algoritmo de provisión dinámica operado de forma autonómica, de forma que se reducen las intervenciones humanas y el sistema es capaz de responder de forma autónoma ante errores, además de operar siempre con un consumo energético mínimo. Asimismo, la tolerancia a fallos en los grandes centros de datos es fundamental para optimizar el uso de los recursos del mismo y garantizar la consistencia de los datos y del procesamiento que se está llevando a cabo. En un sistema con provisión dinámica de nodos, donde la topología del clúster es gestionada por un elemento de gestión de carga, es posible aprovechar esta característica para remplazar nodos problemáticos cuando otros estén disponibles. Este trabajo presenta un sistema de tolerancia a fallos que se integra con el algoritmo de optimización energética basado en provisión dinámica de nodos y permite incrementar la tolerancia a fallos garantizando el cumplimiento del SLA en diversas situaciones de carga y composición del clúster.
El consumo de energía de grandes clústeres de ordenadores afecta a los costes de explotación de centros de datos, en particular incrementando el coste total de posesión (TCO). Por lo tanto, la utilización de algoritmos de minimización de la energía es esencial para una explotación rentable de los centros de datos. El gestor energético presentado en este trabajo se basa en un algoritmo de provisión dinámica operado de forma autonómica, de forma que se reducen las intervenciones humanas y el sistema es capaz de responder de forma autónoma ante errores, además de operar siempre con un consumo energético mínimo. Asimismo, la tolerancia a fallos en los grandes centros de datos es fundamental para optimizar el uso de los recursos del mismo y garantizar la consistencia de los datos y del procesamiento que se está llevando a cabo. En un sistema con provisión dinámica de nodos, donde la topología del clúster es gestionada por un elemento de gestión de carga, es posible aprovechar esta característica para remplazar nodos problemáticos cuando otros estén disponibles. Este trabajo presenta un sistema de tolerancia a fallos que se integra con el algoritmo de optimización energética basado en provisión dinámica de nodos y permite incrementar la tolerancia a fallos garantizando el cumplimiento del SLA en diversas situaciones de carga y composición del clúster.
Collections
- Trabajos Fin de Máster [5220]