22 Feb 2026 · Original en inglés · Resumen IA

Chip Taalas acelera Llama 3 con récord de velocidad

Fuentes: Blog

Una startup llamada Taalas ha lanzado un chip ASIC que ejecuta el modelo de lenguaje Llama 3.1 8B a una velocidad de inferencia de 17.000 tokens por segundo, lo que equivale a escribir aproximadamente 30 páginas A4 por segundo. La empresa afirma que su chip es 10 veces más barato en costos operativos y 10 veces más eficiente energéticamente que los sistemas de inferencia basados en GPU, además de ser 10 veces más rápido. La innovación radica en que Taalas ha "grabado" los pesos del modelo directamente en el chip, eliminando la necesidad de acceder a la memoria externa (VRAM) en cada capa del modelo, lo que solía ser un cuello de botella. El chip utiliza una arquitectura de circuito fijo y no puede ser reprogramado, pero Taalas ha desarrollado un método para personalizar las dos capas superiores para diferentes modelos, reduciendo significativamente el tiempo de desarrollo. La empresa utiliza una pequeña cantidad de SRAM en el chip para la caché KV y adaptadores LoRA. Taalas, con solo 2,5 años de antigüedad, ha logrado un avance significativo en la eficiencia de la inferencia de LLMs, aunque la fabricación de chips personalizados sigue siendo costosa.

Temas

Etiquetas

taalas llama 3.1 asic inteligencia artificial gpu vram sram inferencia chip

Entidades mencionadas

GPU hardware

HBM hardware

Llama 3.1 8B software

Nvidia organization

NVIDIA Corporation es una empresa tecnológica de software y fabless que desarrolla unidades de procesamientos gráficos (GPU), interfaz de programación de aplicaciones (API) para ciencia de datos y com

Ver en Wikipedia

KV cache software

A4 location

LocalLLaMA software

VRAM hardware

Von Neumann bottleneck software

SRAM hardware

LoRA adapters software

eetimes.com organization

EE Times offers reliable electronics news, electrical engineering resources, podcasts, and industry events from Award-winning journalists. Visit to learn more.

Taalas person

La tabla periódica de los elementos es una disposición de los elementos químicos en forma de tabla, ordenados por su número atómico, por su configuración de electrones y sus propiedades químicas. Este

Ver en Wikipedia