Please select your country

STULZ worldwide

Enfriamiento eficiente para la computación de alto rendimiento

Liquid cooling for high-performance computing

Desde hace muchos años, la IA predictiva ha sido una parte integral de muchos sistemas de control y monitoreo de centros de datos. Ayuda a los operadores de centros de datos a aumentar la eficiencia energética y a detectar fallos inminentes en una etapa temprana. Con el triunfo de ChatGPT, el tema de la IA generativa también se está convirtiendo en una megatendencia internacional. Bocetos, textos, imágenes, videos: hoy en día todo se puede procesar o cambiar utilizando IA generativa. Y con Copilot, Microsoft ha integrado su modelo de lenguaje GPT-4 –que también forma la base de ChatGPT– directamente en Windows 11, sus productos de Office 365 y su motor de búsqueda Bing. Este desarrollo requiere capacidades de datos y almacenamiento que hubieran sido impensables hace solo unos años.

Pero también en la ciencia, la medicina y aplicaciones como la conducción autónoma, los requisitos de rendimiento informático son cada vez más exigentes. A esto se suma el hecho de que los servidores utilizados para aplicaciones de IA multiplican sus capacidades de rendimiento y su demanda de energía varias veces con cada nueva generación. Esto crea enormes densidades de energía en los racks y lleva a los sistemas de refrigeración por aire comúnmente utilizados en los centros de datos a sus límites. Por lo tanto, la refrigeración líquida es la opción obvia para enfriar los servidores de manera eficiente y confiable a pesar de esta carga adicional.

 

El método más común de enfriamiento de un centro de datos implica la separación tradicional del centro de datos en pasillos calientes y fríos, en un proceso conocido como contención. Luego, se puede soplar aire frío a través del piso elevado o directamente en los pasillos fríos. Los servidores toman el aire frío por el frente, emiten su calor al aire y lo expulsan nuevamente a los pasillos calientes en la parte trasera del rack. Allí, el aire se conduce a través de conductos hacia las unidades de aire acondicionado y se vuelve a enfriar. Alternativamente, los racks de servidores también pueden ser suministrados con aire frío mediante un sistema de enfriamiento basado en racks.

Aquí, los enfriadores laterales en la parte frontal del rack emiten aire frío a los servidores y toman el aire caliente en la parte trasera para enfriarlo nuevamente. Sin embargo, si un flujo de aire se conduce a través del equipo de TI, generalmente no alcanzará todos los componentes de manera uniforme.
Este efecto es especialmente pronunciado en la refrigeración de aire de sala, mientras que los sistemas de enfriamiento lateral basados en racks, como el Stulz CyberRow, tienen un riesgo mucho menor de formación de puntos calientes. Si solo se utiliza enfriamiento por aire, la densidad de potencia alcanzable por rack es aproximadamente de 50 kW en la práctica. Esta cifra es más que adecuada para muchas aplicaciones de TI, pero rápidamente se convierte en un factor limitante en el caso de sistemas de IA de alto rendimiento

Refrigeración líquida: refrigeración eficiente en energía incluso a altas densidades de potencia.

Si se utiliza refrigeración líquida, en algunos casos no se necesitan pasillos calientes y fríos, ya que la mayor parte de la transferencia de calor tiene lugar en un sistema cerrado sin un medio intermedio. Aquí, solo se requiere refrigeración adicional por aire para enfriar ciertos componentes, como, por ejemplo, las unidades de suministro de energía, y para la carga térmica generada por el tanque mismo si se utiliza la refrigeración por inmersión. Sin embargo, debe haber un espacio suficiente entre los racks o tanques, para permitir el trabajo de mantenimiento o reemplazar el equipo. Como requiere menos espacio, la refrigeración líquida también es ideal para ubicaciones en el borde con poco espacio y temperaturas ambientales que cambian con frecuencia. En general, el líquido puede absorber más calor que el aire, lo que significa que la densidad de potencia también puede aumentar significativamente: con la refrigeración líquida, se pueden lograr cifras de 120 kW por rack sin problema. Incluso las densidades de potencia de 250 kW no son raras en la industria. En el uso práctico, esto plantea demandas adicionales en la infraestructura eléctrica e hidráulica. En lo que respecta a la recuperación de calor residual, la refrigeración líquida tiene ventajas sobre la refrigeración puramente por aire, porque se puede alcanzar un nivel de temperatura más alto, lo que facilita la conexión directa a un intercambiador de calor de transferencia.

Versiones de refrigeración líquida

Actualmente, están disponibles diferentes versiones de refrigeración líquida, que difieren en diseño y eficiencia. En una versión, las partes que se deben enfriar entran directamente en contacto con el líquido refrigerante (refrigeración por inmersión); en la otra, los componentes están equipados con un disipador de calor, a través del cual fluye el líquido refrigerante (refrigeración líquida directa al chip).

 

En la refrigeración líquida directa al chip, es algo más fácil convertir sistemas refrigerados por aire, porque generalmente no es necesario reemplazar por completo los servidores o racks. En un escenario ideal, los servidores existentes simplemente se pueden equipar con disipadores de calor diferentes y los racks con un sistema de distribución, al cual pueden conectarse los tubos de los servidores individuales. Desde aquí, un tubo se dirige fuera del rack y se conecta a una CDU (unidad de distribución de refrigerante).

La CDU luego se conecta mediante un intercambiador de calor al circuito de agua del edificio. Los tubos requeridos para esto pueden ser dirigidos en el piso elevado existente, por ejemplo. La refrigeración líquida directa al chip no tiene problemas para funcionar con agua y no depende necesariamente de un fluido dieléctrico relativamente caro. Sin embargo, existe el riesgo de que el agua se escape en caso de fuga. Por otro lado, si se utiliza un fluido dieléctrico, las fugas no afectarán la confiabilidad operativa del sistema informático.

 

 

 

Cuando se utiliza la refrigeración por inmersión, el costo de convertir sistemas refrigerados por aire es relativamente alto. Por lo general, los servidores existentes deben ser reemplazados por otros que hayan sido especialmente desarrollados para la refrigeración por inmersión, y que luego se operan en bandejas o tanques de fluido dieléctrico. Por lo tanto, los racks existentes ya no se pueden utilizar. Además de una disipación de calor absolutamente uniforme, el líquido también asegura que las placas base ya no absorban polvo y, por lo tanto, ya no necesiten limpieza.

Circulación con o sin bombas: refrigeración líquida de 1 fase y 2 fases

Otra diferencia es la forma en que se circula el líquido refrigerante. En la refrigeración líquida de 1 fase, se selecciona un fluido dieléctrico para garantizar que el calor absorbido no pueda alcanzar su punto de inflamación y siempre permanezca líquido. Para descargar el calor, el líquido se bombea constantemente a través de un intercambiador de calor externo.

En la refrigeración líquida de 2 fases, el líquido cambia perpetuamente su estado de agregación debido a las diferencias de temperatura. Debido a la absorción de calor, el fluido dieléctrico supera su punto de inflamación a una temperatura que depende de su especificación, momento en el cual se vuelve gaseoso y se eleva. Hay un condensador en la parte superior del tanque, que se enfría desde el exterior mediante un circuito de agua. El fluido se enfría cuando alcanza este condensador, se vuelve líquido y vuelve a bajar, donde absorbe calor nuevamente. La ventaja de la versión de 2 fases es que prescinde por completo de bombas y, por lo tanto, se requieren menos piezas móviles. Por otro lado, se debe tener en cuenta el mayor GWP de estos fluidos.

 

Conclusion

El aumento de las cargas térmicas por rack está demandando nuevos métodos de aire acondicionado para centros de datos. Cuando las densidades de potencia superan los 50 kW, actualmente no hay alternativas a la refrigeración líquida. Si se utiliza la versión directa al chip, generalmente se pueden convertir los servidores y racks existentes y seguir utilizándolos. Sin embargo, se requieren varias medidas de conversión en las salas de servidores, y se necesitará adquirir más componentes como los CDUs. Si se está construyendo un centro de datos completamente nuevo de alto rendimiento, la refrigeración por inmersión también debería incluirse en los planes, en cualquier caso, y ambos sistemas deben ser comparados exhaustivamente en la etapa de planificación. Sea cual sea la versión, es importante tener en cuenta que una cierta proporción de enfriamiento por aire también deberá ser utilizada adicionalmente (directo al chip: 20–30% e inmersión 5–10%).