Meta y Zuckerberg demandados por infracción de derechos de autor

Cinco editoriales y el autor Scott Turow demandaron a Meta y a su CEO, Mark Zuckerberg, el martes, acusándolos de infringir derechos de autor al utilizar ilegalmente millones de obras protegidas para entrenar su sistema de lenguaje de inteligencia artificial, Llama. La demanda, presentada en un trib

Meta demandada: Zuckerberg autorizó uso ilegal de libros para IA

Meta y su CEO, Mark Zuckerberg, enfrentan una nueva demanda presentada el martes por cinco editoriales (Hachette, Macmillan, McGraw Hill, Elsevier y Cengage) y el autor Scott Turow, quienes los acusan de infringir masivamente los derechos de autor al copiar millones de libros, artículos y otras obra

LLMs generan mejor código con técnica de 'auto-enseñanza'

El artículo "Embarrassingly Simple Self-Distillation Improves Code Generation" presenta una técnica sorprendentemente sencilla para mejorar la capacidad de los grandes modelos de lenguaje (LLMs) para generar código. En esencia, la técnica, llamada Self-Distillation Simple (SSD), permite que un LLM s

TQ4_1S: LLMs más pequeños para dispositivos Apple

Un desarrollador ha presentado una nueva técnica de compresión de modelos de lenguaje grandes (LLM) llamada TQ4_1S, diseñada específicamente para dispositivos Apple con chips Metal. Esta técnica reduce el tamaño de los modelos en un 27-38%, dependiendo del modelo, sin necesidad de reentrenamiento ni

Galería online compara arquitecturas de LLM

Un repositorio en línea, alojado en sebastianraschka.com, ha sido creado para rastrear y comparar las arquitecturas de los últimos modelos de lenguaje grandes (LLM). La “Galería de Arquitecturas LLM” recopila diagramas y hojas de datos de modelos como Llama 3 8B, DeepSeek V3, Gemma 3, Qwen3, Mistral

Meta defiende uso de obras pirateadas para IA

Meta, la empresa matriz de Facebook e Instagram, ha presentado un nuevo argumento en una demanda presentada por autores como Richard Kadrey y Sarah Silverman, quienes alegan que la empresa utilizó ilegalmente libros protegidos por derechos de autor para entrenar sus modelos de inteligencia artificia

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

LoRAs: Cómo optimizar el reciclaje de modelos IA

El auge de los modelos de lenguaje grandes (LLMs) como Llama ha democratizado la inteligencia artificial, permitiendo a usuarios con menos recursos adaptar estos modelos a tareas específicas mediante técnicas como LoRA (Low-Rank Adaptation). LoRA funciona 'congelando' la mayor parte de los parámetro

IA falla prueba lógica simple: ¿caminar o conducir?

Una prueba sencilla de razonamiento lógico, conocida como la prueba del autolavado, ha revelado que la mayoría de los modelos de inteligencia artificial (IA) líderes, incluyendo versiones de Claude, GPT y Llama, fallan estrepitosamente. La prueba consiste en preguntar a la IA: "Quiero lavar mi coche

llama 70B corre en RTX 3090 con nuevo motor

Un equipo de desarrolladores ha creado un nuevo motor de inferencia de alto rendimiento para modelos de lenguaje grandes (LLM) que permite ejecutar el modelo Llama 70B en una sola tarjeta gráfica RTX 3090. El motor, basado en C++/CUDA, utiliza una técnica de streaming de capas del modelo a través de