PhantaField ha publicado el whitepaper de su procesador PFG-1 'Sophon', un die unificado de entrenamiento e inferencia construido sobre una pila monolítica 3D (M3D) de 32 niveles con transistores 2D de dicalcogenuros de metales de transición (TMD). El diseño elimina por completo la memoria HBM externa: pesos, gradientes y estado del optimizador se almacenan en una DRAM gain-cell 2T0C basada en TMD integrada en el BEOL Metal-3 de cada nivel de memoria, con 330 GB de capacidad y retención de 1,8 segundos sin necesidad de condensador de almacenamiento.
El cómputo es CIM digital puro: cada tile de 256×256 sub-arrays combina un amplificador de sentido binario con un árbol sumador de 8 niveles, alimentado por un broadcast de activaciones bit-serial a 500 MHz. Con 131.072 tiles por die, el chip alcanza 4.200 TFLOPS FP8 y 2.100 TFLOPS BF16 en un footprint de 7,5 cm², con un consumo aproximado de 379 W en forward, 749 W en backward y 373 W en decode FP8.
Según el whitepaper, para un modelo de 80.000 millones de parámetros el die ofrece 2.406 tokens/s en entrenamiento y 7.219 tokens/s en decode BF16 (14.438 en modo FP8), con 38,7 tokens/s por vatio en decode: una eficiencia unas 174 veces superior a la de una GPU NVIDIA Rubin R200 o AMD Instinct MI455X a bajo batch. PhantaField atribuye la ventaja a un ancho de banda de pesos 191–214 veces mayor que el de un paquete HBM4, una brecha que ninguna hoja de ruta de HBM cerraría. El BOM declarado es de 8.358 dólares, frente a los aproximadamente 7,8 millones de un rack NVL72 con Rubin VR200 según estimaciones de Morgan Stanley.
