Conversión a refrigeración líquida de cuatro RTX PRO 6000 Blackwell y la falla de un inductor

Fuentes: 4× RTX PRO 6000 Blackwell on Water, and the One Card That Wouldn't Behave

Un equipo convirtió cuatro tarjetas RTX PRO 6000 Blackwell (GB202, 96 GB GDDR7, 600 W) a un bucle de refrigeración líquida custom para sostener entrenamientos de modelos durante días. La configuración incluye un Threadripper Pro 7995WX sobre WRX90, cuatro waterblocks Bykski full-cover, dos bombas, dos radiadores Alphacool NexXxoS XT45 de 1260 mm con 9 ventiladores de 140 mm cada uno, y dos fuentes de 1500 W (3 kW totales) para alimentar los ~2,4 kW de consumo sostenido. Los cuatro bloques de GPU se conectaron en paralelo para distribuir el calor de forma continua y mantener bajo el ΔT del refrigerante.

La conversión se hizo de forma escalonada: una tarjeta piloto se instaló primero, se probó con cargas reales durante una semana y solo después se convirtieron las tres restantes. La tarjeta piloto empezó a fallar bajo carga sostenida con errores Xid 79 y Xid 154, cayendo del bus PCIe. Diagnosticar el problema requirió desmontar el waterblock y descubrir que un inductor de potencia (choke 85N) del VRM se había despegado de la placa: la soldadura estaba agrietada y el pad térmico, al despegarse en frío, había arrancado el componente.

La lección fue mecánica: los pads térmicos sobre componentes SMD pequeños como inductores y condensadores crean una unión adhesiva que, al retirar el bloque en frío, ejerce fuerza sobre las soldaduras. El procedimiento correcto es calentar la GPU a unos 90 °C con una carga breve, apagarla y desmontar mientras los pads aún están blandos. Con ese método, las tres tarjetas restantes se convirtieron sin incidentes. La reparación del inductor se encargó a un técnico de microsoldadura de una tienda SmartFix en Las Vegas, por 40 dólares y 20 minutos, evitando un RMA de fábrica.