Connected Papers

04 Feb 2026

Self-Attention at Constant Cost per Token via Symmetry-Aware Taylor Approximation

Un nuevo estudio presenta una técnica para optimizar el mecanismo de autoatención en modelos Transformer, reduciendo significativamente los costos de cómputo y memoria. La investigación, basada en una aproximación de Taylor que considera la simetría de las operaciones, permite calcular la autoatenci

07 Feb 2026

IA al límite: Evalúan su capacidad en matemáticas avanzadas

Un nuevo estudio, publicado en arXiv, evalúa la capacidad de los sistemas de inteligencia artificial actuales para responder preguntas de investigación matemática de nivel avanzado. Los autores han creado un conjunto de diez preguntas que surgieron durante su propio proceso de investigación, las cua

07 Feb 2026

RLHF: Guía para el Aprendizaje con Retroalimentación Humana

Este documento presenta un libro introductorio sobre el aprendizaje por refuerzo con retroalimentación humana (RLHF), una técnica crucial para el despliegue de sistemas de aprendizaje automático de última generación. El libro explora los orígenes de RLHF, desde la literatura reciente hasta la conver

10 Feb 2026

IA autónoma: Nuevo test revela fallos en la obediencia

Un nuevo estudio presenta un benchmark para evaluar violaciones de restricciones en agentes de IA autónomos, enfocándose en aquellas impulsadas por la optimización de resultados y no por instrucciones explícitas. El benchmark, compuesto por 40 escenarios, revela que incluso modelos de lenguaje grand

01 Mar 2026

Chorba optimiza CRC32: más eficiencia en la verificación de datos

Chorba: Una nueva implementación de CRC32 para mayor eficiencia. ¿Qué es CRC32 y por qué es importante? CRC32 (Cyclic Redundancy Check) es un algoritmo de checksum ampliamente utilizado para verificar la integridad de datos. Imagina que descargas un archivo de internet; el CRC32 te permite confirmar

11 Mar 2026

Hongos como electrónica: una nueva frontera

La electrónica fúngica es un campo emergente y fascinante que explora la posibilidad de crear dispositivos electrónicos utilizando micelio, la estructura de raíces de los hongos. En esencia, se trata de aprovechar las propiedades eléctricas inherentes a estos organismos para construir sensores, comp

17 Mar 2026

Equipos de IA: Modelos de Lenguaje Colaboran

El auge de los modelos de lenguaje grandes (LLMs) ha abierto la puerta a la creación de 'equipos' de LLMs, donde múltiples modelos colaboran para resolver tareas complejas. Sin embargo, la forma óptima de construir y utilizar estos equipos – cuántos modelos son necesarios, cómo organizarlos, y si su

02 Apr 2026

Modelos de IA: ¿cuál es su límite real?

Este artículo de investigación, publicado en arXiv, introduce un concepto llamado "Horizonte de Error Cero" (ZEH) para evaluar la fiabilidad de los modelos de lenguaje grandes (LLMs) como GPT-5.2 y Qwen2.5. En esencia, el ZEH define el rango máximo dentro del cual un modelo puede resolver problemas

05 Apr 2026

Wavelets para Grafos: Nueva Técnica de Análisis

Este artículo presenta una nueva y poderosa técnica para realizar análisis de Wavelets (transformadas wavelet) no en datos tradicionales como imágenes o señales, sino directamente sobre datos que residen en los nodos de un grafo. Imagina una red social, una malla de sensores, o incluso una represent

24 Apr 2026

Aprendizaje profundo: ¿nace una nueva teoría científica?

Este artículo, publicado en arXiv, plantea una idea revolucionaria: la emergencia de una **teoría científica del aprendizaje profundo (Deep Learning)**. Actualmente, el Deep Learning se basa en gran medida en la experimentación y la optimización empírica, más que en principios teóricos sólidos. Este

05 May 2026

glm-5v-turbo: nuevo modelo para agentes inteligentes

El documento presenta GLM-5V-Turbo, un modelo de lenguaje multimodal de última generación diseñado específicamente para potenciar agentes inteligentes capaces de interactuar con el mundo real. La tendencia actual en inteligencia artificial apunta a crear modelos de lenguaje que no solo procesen text

08 May 2026

IA alucina: ¿por qué ChatGPT inventa información?

El rápido avance de los modelos de lenguaje grandes (LLMs), como ChatGPT, ha generado una gran expectación, pero también una preocupación persistente: las “alucinaciones”. En términos sencillos, una alucinación en un LLM es cuando el modelo genera información incorrecta o inventada, presentándola co

09 May 2026

Cuidado al usar IA con tus documentos: pueden modificarse

La proliferación de modelos de lenguaje grandes (LLMs) ... (the whole summary unchanged)

18 May 2026

Cómo el discurso sobre IA puede cumplir profecías sobre su propia alineación

... full summary ...

Noticias que mencionan Connected Papers