Noticias que mencionan LLaMA

Besimple AI busca un responsable estratégico de proyectos de datos de audio

Besimple AI, empresa respaldada por Y Combinator (X25) y fundada por extrabajadores de Meta procedentes del MIT y la Universidad Brown, ha abierto el puesto de Strategic Projects Lead — Audio Data para liderar de extremo a extremo proyectos de recopilación y anotación de datos de audio destinados a

La economía de la decodificación especulativa en modelos de lenguaje

La decodificación especulativa es una técnica de optimización en inferencia de modelos de lenguaje que acelera la generación de tokens sin pérdida de calidad. Su principio es simple: el modelo predice varios tokens futuros de forma barata y luego verifica solo los aceptados, aprovechando el ancho de

Ruta basada en activaciones activa la calculadora sin leer el prompt

El sistema Rune demuestra que un modelo Llama congelado puede desviar operaciones aritméticas hacia una calculadora Python a partir de lecturas derivadas de sus activaciones internas, sin necesidad de interpretar el texto del prompt. La auditoría, realizada con ejemplos, umbrales y reglas de puntuac

Anatomía de un LLM moderno: de los tokens a la predicción

Los modelos de lenguaje de gran tamaño (LLM) se construyen apilando bloques transformer una y otra vez, por lo que entender la maquinaria del transformer es la base para comprender su funcionamiento. Esta guía recorre los componentes esenciales de un LLM moderno sin profundizar en las matemáticas, c

Nuevo agente 'zot' simplifica el uso de modelos de IA

El proyecto 'zot', disponible a través de zot.sh, lanza una nueva herramienta de codificación diseñada para agilizar la interacción con modelos de lenguaje. Este agente, desarrollado en el lenguaje de programación Go y distribuido como un único binario estático, se destaca por su ligereza y simplici

Spotify defiende la IA musical como mejor opción que la piratería

El CEO de Spotify, Alex Norström, ha defendido la introducción de música generada por inteligencia artificial (IA) en la plataforma, argumentando que ofrece una alternativa controlada a la piratería y al contenido de baja calidad. La semana pasada, la empresa anunció una nueva función que permitirá

Herramienta evalúa el rendimiento de agentes de IA

Desarrolladores ahora tienen una nueva herramienta llamada `agent-skills-eval` para probar y validar la efectividad de las 'Skills' de Agent Skills, un estándar abierto de Anthropic para dotar a los agentes de conocimiento específico. La herramienta funciona comparando la salida del modelo con y sin

Meta y Zuckerberg demandados por infracción de derechos de autor

Cinco editoriales y el autor Scott Turow demandaron a Meta y a su CEO, Mark Zuckerberg, el martes, acusándolos de infringir derechos de autor al utilizar ilegalmente millones de obras protegidas para entrenar su sistema de lenguaje de inteligencia artificial, Llama. La demanda, presentada en un trib

Meta demandada: Zuckerberg autorizó uso ilegal de libros para IA

Meta y su CEO, Mark Zuckerberg, enfrentan una nueva demanda presentada el martes por cinco editoriales (Hachette, Macmillan, McGraw Hill, Elsevier y Cengage) y el autor Scott Turow, quienes los acusan de infringir masivamente los derechos de autor al copiar millones de libros, artículos y otras obra

IA recuerda: Stash crea memoria persistente para agentes

Stash, una nueva capa de memoria persistente para agentes de IA, ha sido presentada por Mohamed Al-Ashaal. La herramienta busca resolver el problema de que los agentes de IA, como ChatGPT y Claude, no retienen información entre sesiones, obligando a los usuarios a repetir constantemente la misma inf

Ollama enfrenta críticas por falta de reconocimiento a su base

Ollama, una popular herramienta para ejecutar modelos de lenguaje grandes (LLM) localmente, enfrenta acusaciones de engaño y falta de atribución a su tecnología base, llama.cpp. Fundada en 2021, Ollama inicialmente se destacó por facilitar el acceso a llama.cpp, un motor de inferencia creado por Geo

LLMs generan mejor código con técnica de 'auto-enseñanza'

El artículo "Embarrassingly Simple Self-Distillation Improves Code Generation" presenta una técnica sorprendentemente sencilla para mejorar la capacidad de los grandes modelos de lenguaje (LLMs) para generar código. En esencia, la técnica, llamada Self-Distillation Simple (SSD), permite que un LLM s

SwiftLM: LLMs nativos y rápidos en Apple Silicon

Un equipo de desarrolladores ha lanzado SwiftLM, un servidor de inferencia nativo para dispositivos Apple Silicon que ofrece compatibilidad con la API de OpenAI. Esta herramienta, de código abierto, elimina la necesidad de un entorno de ejecución de Python y el Global Interpreter Lock (GIL), lo que

IA: Tokens, el costo secreto que infla las facturas

El uso de modelos de inteligencia artificial como GPT-4, Claude y Gemini, aparentemente económicos, está resultando significativamente más costoso de lo que parece. La clave reside en la unidad de medida utilizada: los 'tokens'. A diferencia de lo que muchos usuarios creen, no se paga por palabra, s

Ingeniero crea sistema RAG interno con LLM

Este artículo narra la experiencia de un ingeniero al construir un sistema de Recuperación Aumentada de Generación (RAG) interno para su empresa, utilizando un modelo de lenguaje grande (LLM) local. El objetivo era crear una herramienta de chat que permitiera a los ingenieros acceder rápidamente a i

Hume AI libera TADA: voz IA más rápida y precisa

Hume AI ha abierto el código de TADA, una innovadora tecnología que busca revolucionar la generación de voz por inteligencia artificial. TADA resuelve un problema fundamental en los sistemas actuales de texto a voz (TTS) basados en modelos de lenguaje grandes (LLM): la incompatibilidad entre la repr

Meta defiende uso de obras pirateadas para IA

Meta, la empresa matriz de Facebook e Instagram, ha presentado un nuevo argumento en una demanda presentada por autores como Richard Kadrey y Sarah Silverman, quienes alegan que la empresa utilizó ilegalmente libros protegidos por derechos de autor para entrenar sus modelos de inteligencia artificia

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

IA india 'Indus': ¿soberanía o misterio?

La startup india Sarvam AI ha generado controversia tras recibir una importante financiación pública (10.000 crore de rupias en un fondo nacional) y lanzar su modelo de IA 'Indus', con 105 mil millones de parámetros, que supuestamente supera a modelos más grandes como Gemini Flash. Si bien la empres