inferencia
5 noticias
Samsung sube precios de DRAM, pero mercado baja
Samsung ha anunciado un incremento del 30% en los precios de la memoria DRAM para los contratos del segundo trimestre de 2026. Sin embargo, a pesar de este aumento previsto, los mercados minoristas y secundarios están experimentando una inesperada caída de precios. Esta divergencia se debe a varios
LLMs ejecutan programas: IA más rápida y potente
Investigadores de Percepta han demostrado la capacidad de ejecutar programas directamente dentro de modelos de lenguaje grandes (LLMs), como los transformers, logrando una velocidad de inferencia exponencialmente más rápida. El avance, anunciado el 11 de marzo de 2026, abre nuevas posibilidades para
Chip Taalas acelera Llama 3 con récord de velocidad
Una startup llamada Taalas ha lanzado un chip ASIC que ejecuta el modelo de lenguaje Llama 3.1 8B a una velocidad de inferencia de 17.000 tokens por segundo, lo que equivale a escribir aproximadamente 30 páginas A4 por segundo. La empresa afirma que su chip es 10 veces más barato en costos operativo
Modelwrap: Tinfoil verifica modelos de IA
Tinfoil ha presentado Modelwrap, una nueva herramienta para verificar la integridad de los modelos de IA, abordando una preocupación creciente en la industria: la falta de transparencia sobre qué modelos se están ejecutando realmente en las APIs de inferencia. Actualmente, los usuarios a menudo no p
Modelos de lenguaje: nueva técnica impulsa la velocidad
Investigadores han desarrollado una nueva técnica llamada Consistency Diffusion Language Models (CDLM) que acelera significativamente la inferencia de modelos de lenguaje de difusión (DLMs). CDLM logra hasta 14.5 veces más velocidad en tareas de matemáticas y programación, sin sacrificar la calidad
