Talos: Nuevo Hardware Acelera Redes Neuronales

Fuentes: New Hardware Accelerator 'Talos' Promises Extreme Efficiency for CNNs

Un equipo de ingenieros ha desarrollado 'Talos', un acelerador de hardware personalizado basado en FPGA diseñado para ejecutar redes neuronales convolucionales (CNN) con una eficiencia extrema. A diferencia de las implementaciones de software tradicionales, Talos elimina la sobrecarga de tiempo de ejecución, el programador y el sistema operativo, optimizando el proceso de inferencia a nivel de circuito a través de la implementación en SystemVerilog. El proyecto, completado en dos semanas de intenso trabajo, prioriza la eficiencia y el determinismo, logrando un control preciso sobre cada cálculo. Talos utiliza aritmética de punto fijo Q16.16 para representar los datos, lo que permite una ejecución más rápida, menor uso de memoria y, potencialmente, menor consumo de energía en comparación con frameworks como PyTorch. La arquitectura se centra en la optimización de la inferencia, eliminando elementos innecesarios y utilizando una tubería de transmisión para evitar el almacenamiento de mapas de características completos. El diseño incluye una capa convolucional, una capa ReLU, una capa MaxPool y una capa totalmente conectada, todo ello optimizado para la inferencia eficiente.