modelos de lenguaje

01 Apr 2026

Ciencia de datos: LLMs cambian el panorama laboral

El auge del científico de datos, considerado en su momento como “el trabajo más sexy del siglo XXI”, está experimentando una redefinición debido a la proliferación de las APIs de modelos de lenguaje grandes (LLMs). La facilidad de integración de estos modelos, que antes requerían la intervención de

31 Mar 2026

ia más eficiente: modelos 'bonsai' reducen consumo

Una nueva generación de modelos de inteligencia artificial, denominados 'Bonsai', está prometiendo importantes avances en eficiencia. Desarrollados por PrismML, estos modelos de 1 bit representan una innovación significativa al requerir una fracción de la memoria y consumir menos energía que los mod

31 Mar 2026

Filtran código de Claude Code: revelan defensas y funcionamiento interno

Anthropic, la empresa detrás de Claude Code, sufrió una filtración accidental de código fuente de su herramienta CLI, revelando detalles sobre mecanismos de defensa y funcionamiento interno. La filtración, ocurrida el 16 de mayo, es la segunda en una semana y ha generado especulaciones sobre posible

31 Mar 2026

IA descubre fallos de seguridad: una revolución silenciosa

Investigadores advierten que la inteligencia artificial (IA) está revolucionando la investigación de vulnerabilidades de seguridad, pero no de la manera que se anticipaba. En lugar de generar vulnerabilidades a través de herramientas de análisis complejas, los modelos de IA de vanguardia, como Claud

31 Mar 2026

IA: cuidado con la escritura automática

El artículo "Don't Let AI Write For You" de alexhwoods.com plantea una advertencia crucial sobre el uso creciente de modelos de lenguaje grandes (LLMs) para generar contenido escrito, especialmente en entornos profesionales y técnicos. No se trata de demonizar la IA, sino de comprender cómo su uso i

31 Mar 2026

Claude más eficiente: herramienta reduce el tamaño de respuestas

Un desarrollador ha creado una herramienta, disponible en GitHub, que reduce significativamente la verbosidad de las respuestas de Claude, el modelo de lenguaje de Anthropic, en aproximadamente un 63% sin necesidad de modificar el código existente. La herramienta, implementada a través de un archivo

30 Mar 2026

Internet: ¿Un 'Bosque Oscuro' Cognitivo?

El artículo "The Cognitive Dark Forest" plantea una reflexión inquietante sobre la evolución de Internet y el impacto de la inteligencia artificial, comparándolo con el concepto de "Dark Forest" de la novela china "El Problema de los Tres Cuerpos". Originalmente, la web era un espacio abierto donde

25 Mar 2026

Google presenta TurboQuant: IA más rápida y eficiente

Investigadores de Google Research han anunciado TurboQuant, un nuevo algoritmo de compresión que promete mejorar significativamente la eficiencia de los modelos de lenguaje grandes y los sistemas de búsqueda vectorial. Presentado el 24 de marzo de 2026, TurboQuant aborda el problema del “overhead” d

24 Mar 2026

Mozilla crea 'Stack Overflow' para inteligencia artificial

Mozilla AI está explorando la creación de una plataforma llamada 'cq', esencialmente un 'Stack Overflow para agentes de IA'. La iniciativa surge de la observación de que los agentes de IA, al igual que los desarrolladores, a menudo resuelven los mismos problemas de forma independiente, desperdiciand

17 Mar 2026

Unsloth Studio: IA fácil con su interfaz sin código

Unsloth AI ha lanzado Unsloth Studio (Beta), una interfaz de usuario web de código abierto y sin necesidad de programación para entrenar, ejecutar y exportar modelos de IA de código abierto localmente. La herramienta, disponible para Windows, Linux, WSL y MacOS (con soporte limitado para entrenamien

17 Mar 2026

Problemas en Claude: IA Anthropic sufre interrupción

La plataforma de inteligencia artificial Claude, desarrollada por Anthropic, está experimentando una interrupción en el servicio. La incidencia, reportada hace aproximadamente 30 minutos, ha provocado que la plataforma sea inaccesible para sus usuarios. La página de estado de Claude (status.claude.c

17 Mar 2026

Kagi Translate: Traducción privada impulsada por IA

Kagi, el motor de búsqueda centrado en la privacidad, ha anunciado el lanzamiento de Kagi Translate, un nuevo servicio de traducción impulsado por modelos de lenguaje avanzados. La plataforma, disponible desde hoy, permite traducir texto, documentos, páginas web y contenido de diccionarios. Kagi Tra

15 Mar 2026

IA: ¿perdemos autenticidad al 'limpiar' mensajes?

El artículo de Sebastian Aigner aborda un problema sutil pero creciente en la era de la inteligencia artificial: la degradación de la comunicación personal al utilizar modelos de lenguaje grandes (LLMs) para 'limpiar' o reformular mensajes. La idea central es que, aunque los LLMs pueden mejorar la g

14 Mar 2026

Peek: i.a. optimiza el uso de Claude Code

La startup gopeek.ai ha lanzado Peek, una herramienta que mejora significativamente la interacción con Claude Code, el modelo de lenguaje de código de Anthropic, a través del aprendizaje automático. Peek analiza las preferencias del usuario y las inyecta automáticamente en el proceso de interacción,

13 Mar 2026

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

13 Mar 2026

LLMs ejecutan programas: IA más rápida y potente

Investigadores de Percepta han demostrado la capacidad de ejecutar programas directamente dentro de modelos de lenguaje grandes (LLMs), como los transformers, logrando una velocidad de inferencia exponencialmente más rápida. El avance, anunciado el 11 de marzo de 2026, abre nuevas posibilidades para

12 Mar 2026

Claude genera gráficos interactivos en conversaciones

Anthropic ha lanzado una nueva función en beta para su modelo de lenguaje Claude que permite la creación de visualizaciones interactivas directamente dentro de las conversaciones. A partir del 12 de marzo de 2026, Claude puede generar gráficos, diagramas y otras representaciones visuales en tiempo r

12 Mar 2026

Avance de IA se ralentiza: ¿llegan los LLM a un límite?

Un reciente estudio realizado por Metr.org sugiere que la mejora en las capacidades de programación de los modelos de lenguaje grandes (LLM) podría haber alcanzado un punto de meseta. La investigación, publicada en entropicthoughts.com, analiza el rendimiento de los LLM en tareas de programación, co

12 Mar 2026

Programar a mano: Madden cuestiona el uso de IA

Neil Madden, en su blog y posteriormente en Mastodon, plantea una reflexión profunda sobre el aprendizaje de programación y el uso de modelos de lenguaje grandes (LLMs) como ChatGPT. Su argumento central no es una crítica directa a la tecnología, sino una defensa de un método de aprendizaje más efec

12 Mar 2026

LLMs aprueban prueba, pero no siempre sirven al código

Este informe de METR analiza la discrepancia entre los resultados de los modelos de lenguaje grandes (LLMs) en el benchmark SWE-bench Verified y su utilidad real en proyectos de código abierto. SWE-bench Verified es una herramienta para evaluar la capacidad de los LLMs para resolver problemas de pro

11 Mar 2026

Hume AI libera TADA: voz IA más rápida y precisa

Hume AI ha abierto el código de TADA, una innovadora tecnología que busca revolucionar la generación de voz por inteligencia artificial. TADA resuelve un problema fundamental en los sistemas actuales de texto a voz (TTS) basados en modelos de lenguaje grandes (LLM): la incompatibilidad entre la repr

10 Mar 2026

Google Gemini: ¿el futuro de la IA?

Google ha lanzado una nueva versión de su modelo Gemini, denominada 3.1 Flash-Lite, destacando por su velocidad y capacidad, especialmente en tareas visuales. El lanzamiento se produce en un contexto de creciente competencia en el campo de la inteligencia artificial, con Anthropic y OpenAI enfocándo

10 Mar 2026

Ciencia frente a la complejidad: ¿basta con las ecuaciones?

Durante la mayor parte de la historia humana, los fenómenos complejos se atribuían a lo místico. Con el tiempo, la ciencia, con sus concisas ecuaciones (F=ma, E=mc², PV=nRT), logró comprimir vastas cantidades de información en modelos manejables, diseñados para ser comprendidos y aplicados por la me

10 Mar 2026

Debian frena debate sobre contribuciones con IA

La distribución Debian ha pospuesto indefinidamente una votación sobre una propuesta para regular las contribuciones asistidas por inteligencia artificial (IA), tras un debate interno sobre la definición de 'IA' y el impacto en el proceso de incorporación de nuevos desarrolladores. La propuesta orig

10 Mar 2026

IA OpenClaw: Éxito Viral y Solución Innovadora en China

Un agente de IA de código abierto llamado OpenClaw ha experimentado una adopción masiva en China en tan solo 100 días, generando largas colas de usuarios frente a las oficinas de Tencent en Shenzhen para su instalación gratuita. El proyecto, creado por el ingeniero austriaco Peter Steinberger, permi

07 Mar 2026

ia revela sus clichés: guía para mejorar la escritura

Un recurso en línea llamado tropes.fyi ha catalogado una serie de patrones de escritura comunes generados por la inteligencia artificial, con el objetivo de ayudar a los desarrolladores a mejorar la calidad de la IA generativa. El documento, creado con asistencia de IA, identifica clichés como el us

07 Mar 2026

Sarvam AI libera modelos de lenguaje hechos en India

Sarvam AI ha lanzado de forma abierta los modelos de lenguaje Sarvam 30B y Sarvam 105B, diseñados para razonamiento y optimizados para el despliegue eficiente en una amplia gama de hardware, desde GPUs de alto rendimiento hasta dispositivos personales. El entrenamiento se llevó a cabo íntegramente e

06 Mar 2026

IA y empleo: nueva métrica evalúa el impacto real

Este informe de Anthropic.com analiza el impacto potencial de la inteligencia artificial (IA) en el mercado laboral, presentando una nueva métrica llamada 'exposición observada' para medirlo. A diferencia de enfoques anteriores que sobreestimaron la vulnerabilidad laboral (como la medición de 'offsh

04 Mar 2026

Qwen: Renuncia clave investigador de modelo de Alibaba

Un importante movimiento ha sacudido al equipo de desarrollo de Qwen, una familia de modelos de lenguaje de código abierto de Alibaba. El 4 de marzo de 2026, Junyang Lin, el investigador principal y figura clave detrás de la liberación de los modelos Qwen desde 2024, anunció su inesperada renuncia a

03 Mar 2026

IA en videojuegos: ¿dónde están las promesas?

El artículo de Frank Lantz explora una paradoja intrigante: a pesar del auge de la inteligencia artificial, no hemos visto una revolución en los videojuegos impulsada por esta tecnología. El autor plantea la pregunta de por qué, después de años de promesas, la IA no ha generado experiencias de juego

03 Mar 2026

claude.ai: aumentan los fallos, empresa informa

Anthropic, la empresa detrás del modelo de lenguaje Claude.ai, ha reportado un aumento en errores y fallos en su servicio. La compañía ha habilitado un sistema de notificaciones por correo electrónico y mensajes de texto para mantener a los usuarios informados sobre la creación y resolución de estos

01 Mar 2026

Ingeniero simplifica modelos GPT a 200 líneas de código

Un ingeniero ha simplificado significativamente los modelos de lenguaje grandes (LLM) como GPT, creando una versión funcional en tan solo 200 líneas de código Python. Esta hazaña, denominada 'microgpt', representa un hito en la accesibilidad y comprensión de la tecnología detrás de herramientas como

26 Feb 2026

OpenAI: ¿amenaza a su liderazgo en IA?

Un análisis reciente de Benedict Evans plantea serias dudas sobre la capacidad de OpenAI para mantener su ventaja competitiva a largo plazo. A pesar de contar con una base de usuarios considerable (800-900 millones), la participación es superficial, con la mayoría de los usuarios interactuando solo

25 Feb 2026

IA prefiere 'Marcus': estudio revela patrón curioso

Un estudio reciente realizado por Benjismith ha revelado un comportamiento inesperado en modelos de lenguaje de inteligencia artificial (IA) al solicitarles que elijan nombres al azar. Tras realizar 37.500 pruebas con el modelo Claude y diversas variaciones de prompts, los investigadores encontraron

25 Feb 2026

HN: Cuentas nuevas usan símbolos, alerta de bots

HN: Cuentas nuevas usan símbolos, alerta de bots En las últimas semanas, la comunidad de Hacker News (HN), una plataforma de discusión popular entre programadores y entusiastas de la tecnología, ha expresado una creciente preocupación por una posible inundación de cuentas automatizadas, o 'bots'. L

24 Feb 2026

Steerling-8B: IA interpretable y eficiente

## Steerling-8B: IA Interpretable y Eficiente Revoluciona el Control de Modelos de Lenguaje En un avance significativo para la inteligencia artificial, Guide Labs ha presentado Steerling-8B, el primer modelo de lenguaje inherentemente interpretable capaz de rastrear cada token generado hasta su con

23 Feb 2026

ia reproduce novelas: ¿copia o aprendizaje?

Modelos de inteligencia artificial líderes como los de OpenAI, Google, Meta, Anthropic y xAI están demostrando la capacidad de generar copias casi textuales de novelas populares, según revela un informe del Financial Times basado en estudios recientes. Esta capacidad, denominada "memorización" por e

21 Feb 2026

IA sorprende: revoluciona el campo de las matemáticas

Este artículo explora el rápido avance de la inteligencia artificial (IA) en el campo de las matemáticas, desafiando predicciones anteriores sobre el ritmo de progreso. Inicialmente, el autor, Daniel Litt, observó que los modelos de lenguaje grandes (LLMs) podían generar pruebas matemáticas correcta

21 Feb 2026

Modelwrap: Tinfoil verifica modelos de IA

Tinfoil ha presentado Modelwrap, una nueva herramienta para verificar la integridad de los modelos de IA, abordando una preocupación creciente en la industria: la falta de transparencia sobre qué modelos se están ejecutando realmente en las APIs de inferencia. Actualmente, los usuarios a menudo no p

20 Feb 2026

IA: ¿Homogeneiza la creatividad?

El artículo "AI makes you boring" plantea una crítica inusual sobre el impacto de la inteligencia artificial (IA) en la creatividad y la calidad de las discusiones técnicas, más allá de la simple eficiencia en el desarrollo de software. No se trata de un rechazo a la IA como herramienta, sino de una

20 Feb 2026

Modelos de lenguaje: nueva técnica impulsa la velocidad

Investigadores han desarrollado una nueva técnica llamada Consistency Diffusion Language Models (CDLM) que acelera significativamente la inferencia de modelos de lenguaje de difusión (DLMs). CDLM logra hasta 14.5 veces más velocidad en tareas de matemáticas y programación, sin sacrificar la calidad

19 Feb 2026

IA: Resúmenes engañosos y riesgos ocultos

Este artículo de Roya Pakzad advierte sobre los peligros de confiar ciegamente en las herramientas de resumen de IA, especialmente en contextos de alta importancia y con implicaciones para la seguridad y la justicia social. El problema central no es la tecnología en sí misma, sino la facilidad con l

19 Feb 2026

IA engañada: usuario la hace afirmar falsedades

El desarrollador Thomas Germain ha descubierto y demostrado una técnica para engañar a modelos de inteligencia artificial como ChatGPT y Google, haciéndoles afirmar falsamente a otros usuarios que él es un campeón mundial de comer perritos calientes. Germain reveló el truco en la plataforma bsky.app

18 Feb 2026

Lean: matemáticas formalizadas impulsan la IA

Un matemático con experiencia en programación está explorando el uso del sistema de demostración de teoremas Lean para formalizar las matemáticas, con el objetivo de revolucionar la escritura matemática y el desarrollo de la inteligencia artificial. La formalización, que implica verificar mecánicame

18 Feb 2026

IA ayuda a científicos: nace 'Rathbun's Operator'

Este artículo explora el proyecto “Rathbun’s Operator”, una iniciativa que involucra un agente autónomo de código llamado MJ Rathbun, diseñado para contribuir a proyectos de código abierto científico. El autor, quien permanece anónimo, buscaba determinar si un agente impulsado por modelos de lenguaj

17 Feb 2026

Claude Sonnet 4.6: Anthropic mejora su IA

Anthropic ha lanzado Claude Sonnet 4.6, la versión más avanzada hasta la fecha de su modelo Sonnet. Esta actualización representa una mejora significativa en diversas áreas, incluyendo codificación, uso de computadoras, razonamiento con contexto extenso, planificación de agentes, trabajo de conocimi

17 Feb 2026

IA pierde originalidad: surge el término 'abolición semántica'

Un nuevo término, 'abolición semántica', ha surgido para describir un problema crítico en la escritura generada por IA: la pérdida de originalidad y profundidad. Según un artículo de The Register, este fenómeno ocurre porque los modelos de lenguaje, al buscar optimizar la probabilidad estadística y

16 Feb 2026

Descompilación de Snowboard Kids 2: Un Nuevo Enfoque

Este artículo del blog de Chris Lewis detalla la evolución de un flujo de trabajo para la descompilación de código, específicamente enfocado en el juego Snowboard Kids 2 para Nintendo 64. Inicialmente, el proceso se basaba en priorizar funciones a descompilar según su dificultad estimada, utilizando

16 Feb 2026

Agentes de IA: Caché Oculta Costos Elevados

Un nuevo análisis revela costos ocultos y significativos en el uso de agentes de codificación basados en modelos de lenguaje grandes (LLMs). Según un estudio realizado por exe.dev, los costos de lectura de caché (cache reads) crecen de forma cuadrática a medida que la longitud del contexto aumenta,

15 Feb 2026

Alibaba crea RynnBrain: IA que 've' y comprende el mundo

RynnBrain es un modelo de base encarnado (embodied foundation model) desarrollado por Alibaba Damo Academy, diseñado para comprender e interactuar con el mundo físico de una manera más profunda que los modelos de lenguaje tradicionales. Imagina un modelo que no solo entiende el lenguaje, sino que ta

15 Feb 2026

LLM más rápidos: Anthropic y OpenAI usan métodos distintos

Anthropic y OpenAI han anunciado recientemente una función de "modo rápido" para sus modelos de codificación, permitiendo interacciones significativamente más rápidas. Sin embargo, los enfoques difieren considerablemente. La opción de Anthropic ofrece una mejora de hasta 2.5 veces en tokens por segu

14 Feb 2026

Desinformación online: La IA complica la búsqueda de verdad

Este artículo de blog, escrito por Space en Nicole.express, expresa una creciente preocupación sobre la proliferación de información errónea en internet, exacerbada por el auge de los modelos de lenguaje grandes (LLMs). El punto de partida es un juego de Sega Genesis japonés llamado *Phantasy Star F

12 Feb 2026

Anthropic: $30B en financiación impulsa su valoración a $380B

Anthropic, la empresa de inteligencia artificial detrás del modelo de lenguaje Claude, ha recaudado 30 mil millones de dólares en una ronda de financiación Serie G, liderada por GIC y Coatue. Esta inversión eleva la valoración de la empresa a 380 mil millones de dólares post-money, convirtiéndola en

12 Feb 2026

MiniMax M2.5: IA eficiente para tareas complejas

MiniMax ha anunciado el lanzamiento de su nuevo modelo de lenguaje, MiniMax M2.5, diseñado para aumentar la productividad en tareas del mundo real. El modelo, entrenado con aprendizaje por refuerzo en una amplia variedad de entornos complejos, destaca en programación, uso de herramientas, búsqueda y

07 Feb 2026

Claude Code: Anthropic acelera con 'Fast Mode' (descuento)

Anthropic ha lanzado 'Fast Mode' para su modelo de código Claude Code, una función en fase de investigación que prioriza la velocidad de respuesta sobre la eficiencia de costes. Disponible hasta el 16 de febrero con un descuento del 50%, Fast Mode utiliza la misma calidad y capacidades del modelo Op

07 Feb 2026

Libro explica RLHF: guía para IA con retroalimentación humana

Nathan Lambert ha publicado un libro introductorio sobre RLHF (Reinforcement Learning from Human Feedback), una técnica crucial para el desarrollo y despliegue de sistemas de aprendizaje automático, especialmente modelos de lenguaje. El libro está dirigido a personas con conocimientos cuantitativos

07 Feb 2026

IA Gemma 3B: Ejecútala en Linux con Ollama

Usuarios de Linux ahora pueden ejecutar el modelo de inteligencia artificial Gemma 3B localmente gracias a la herramienta Ollama. La instalación, descrita como sencilla, permite a los usuarios descargar y probar modelos pre-entrenados sin necesidad de configurar entornos de desarrollo complejos. Oll

04 Feb 2026

Self-Attention at Constant Cost per Token via Symmetry-Aware Taylor Approximation

Un nuevo estudio presenta una técnica para optimizar el mecanismo de autoatención en modelos Transformer, reduciendo significativamente los costos de cómputo y memoria. La investigación, basada en una aproximación de Taylor que considera la simetría de las operaciones, permite calcular la autoatenci