llama - ojeo.com

07 Jun 2026

Ruta basada en activaciones activa la calculadora sin leer el prompt

El sistema Rune demuestra que un modelo Llama congelado puede desviar operaciones aritméticas hacia una calculadora Python a partir de lecturas derivadas de sus activaciones internas, sin necesidad de interpretar el texto del prompt. La auditoría, realizada con ejemplos, umbrales y reglas de puntuac

06 Jun 2026

La IA alcanza el 76 % de precisión en consultas de salud, según un estudio

Los asistentes virtuales de inteligencia artificial responden a preguntas cotidianas de salud de usuarios generales con una precisión del 76,2 %, según un estudio dirigido por investigadores de Penn State (Estados Unidos) que se presentará en la conferencia FAccT 2026 de Montreal, del 25 al 28 de ju

05 Jun 2026

Ajuste fino de un LLM para escribir documentación al estilo de 1995

El autor detalla un experimento personal de ajuste fino (fine-tuning) de un modelo de lenguaje para que genere documentación técnica al estilo de los años 80 y 90. La motivación es explorar la predicción de que los redactores técnicos del futuro trabajarán con modelos locales especializados, en luga

05 May 2026

Meta y Zuckerberg demandados por infracción de derechos de autor

Cinco editoriales y el autor Scott Turow demandaron a Meta y a su CEO, Mark Zuckerberg, el martes, acusándolos de infringir derechos de autor al utilizar ilegalmente millones de obras protegidas para entrenar su sistema de lenguaje de inteligencia artificial, Llama. La demanda, presentada en un trib

05 May 2026

Meta demandada: Zuckerberg autorizó uso ilegal de libros para IA

Meta y su CEO, Mark Zuckerberg, enfrentan una nueva demanda presentada el martes por cinco editoriales (Hachette, Macmillan, McGraw Hill, Elsevier y Cengage) y el autor Scott Turow, quienes los acusan de infringir masivamente los derechos de autor al copiar millones de libros, artículos y otras obra

04 Apr 2026

LLMs generan mejor código con técnica de 'auto-enseñanza'

El artículo "Embarrassingly Simple Self-Distillation Improves Code Generation" presenta una técnica sorprendentemente sencilla para mejorar la capacidad de los grandes modelos de lenguaje (LLMs) para generar código. En esencia, la técnica, llamada Self-Distillation Simple (SSD), permite que un LLM s

04 Apr 2026

TQ4_1S: LLMs más pequeños para dispositivos Apple

Un desarrollador ha presentado una nueva técnica de compresión de modelos de lenguaje grandes (LLM) llamada TQ4_1S, diseñada específicamente para dispositivos Apple con chips Metal. Esta técnica reduce el tamaño de los modelos en un 27-38%, dependiendo del modelo, sin necesidad de reentrenamiento ni

15 Mar 2026

Galería online compara arquitecturas de LLM

Un repositorio en línea, alojado en sebastianraschka.com, ha sido creado para rastrear y comparar las arquitecturas de los últimos modelos de lenguaje grandes (LLM). La “Galería de Arquitecturas LLM” recopila diagramas y hojas de datos de modelos como Llama 3 8B, DeepSeek V3, Gemma 3, Qwen3, Mistral

07 Mar 2026

Meta defiende uso de obras pirateadas para IA

Meta, la empresa matriz de Facebook e Instagram, ha presentado un nuevo argumento en una demanda presentada por autores como Richard Kadrey y Sarah Silverman, quienes alegan que la empresa utilizó ilegalmente libros protegidos por derechos de autor para entrenar sus modelos de inteligencia artificia

26 Feb 2026

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

25 Feb 2026

LoRAs: Cómo optimizar el reciclaje de modelos IA

El auge de los modelos de lenguaje grandes (LLMs) como Llama ha democratizado la inteligencia artificial, permitiendo a usuarios con menos recursos adaptar estos modelos a tareas específicas mediante técnicas como LoRA (Low-Rank Adaptation). LoRA funciona 'congelando' la mayor parte de los parámetro

23 Feb 2026

IA falla prueba lógica simple: ¿caminar o conducir?

Una prueba sencilla de razonamiento lógico, conocida como la prueba del autolavado, ha revelado que la mayoría de los modelos de inteligencia artificial (IA) líderes, incluyendo versiones de Claude, GPT y Llama, fallan estrepitosamente. La prueba consiste en preguntar a la IA: "Quiero lavar mi coche

21 Feb 2026

llama 70B corre en RTX 3090 con nuevo motor

Un equipo de desarrolladores ha creado un nuevo motor de inferencia de alto rendimiento para modelos de lenguaje grandes (LLM) que permite ejecutar el modelo Llama 70B en una sola tarjeta gráfica RTX 3090. El motor, basado en C++/CUDA, utiliza una técnica de streaming de capas del modelo a través de