arxiv - ojeo.com

01 Jul 2026

arXiv se independiza de la Universidad de Cornell el 1 de julio de 2026

El repositorio de preprints científicos arXiv dejará de depender de la Universidad de Cornell el 1 de julio de 2026, cuando se constituya como organización sin ánimo de lucro independiente tras 25 años de vinculación con la institución académica. El cambio, que se venía gestando desde hace tiempo, a

29 Jun 2026

Una guía técnica reconstruye por ingeniería inversa el Apple Neural Engine

El Apple Neural Engine (ANE) es el acelerador de matriz de función fija integrado en los chips de la casa desde el SoC A11 (iPhone y iPad) y la familia M1 (Mac), al que las aplicaciones sólo acceden a través del framework Core ML. Una nueva guía técnica, depositada en arXiv por Spencer Bryngelson, o

29 Jun 2026

Dos artículos de Max Planck, retirados en silencio por el editor durante la digitalización

Dos artículos científicos del Premio Nobel de Física Max Planck fueron retirados de forma inusual de la revista especializada "Die Naturwissenschaften" —hoy "The Science of Nature"—, probablemente desde 2005, y desde entonces no pueden descargarse de la editorial. Así lo sostienen los historiadores

28 Jun 2026

Proxy-KD: destilar conocimiento de modelos de lenguaje cerrados

Investigadores presentan Proxy-KD, un método de destilación de conocimiento diseñado para transferir el saber de grandes modelos de lenguaje (LLM) propietarios y opacos —como GPT-4— a modelos más pequeños y ligeros. La destilación de conocimiento tradicional requiere acceder a los estados internos d

28 Jun 2026

Una revista retracta por error dos artículos de Max Planck de los años 40

Dos historiadores de la física han descubierto que la revista Naturwissenschaften, ahora llamada The Science of Nature, ha retirado sin explicación dos artículos publicados por el físico alemán Max Planck —premio Nobel de Física en 1918 por su descubrimiento de los cuantos— en la década de 1940. Los

28 Jun 2026

Un computador probabilístico programable alcanza un millón de p-bits enlazando FPGAs

Investigadores han construido un computador probabilístico programable con un millón de p-bits, al conectar varias FPGAs en una única máquina de Ising que supera la capacidad de un solo chip. El sistema ejecuta muestreo de Gibbs a más de un billón de flips por segundo y mantiene todos los pesos de a

26 Jun 2026

Un estudio detecta que las IAs repiten los mismos nombres y escenarios en sus relatos

Un estudio de la Universidad de Cornell, difundido en arXiv, ha analizado más de 20.000 relatos generados por modelos de lenguaje y ha detectado patrones repetitivos sistemáticos. Un grupo reducido de palabras aparece en el 88% de las historias, con nombres como Elias, Mara o Elara y profesiones com

25 Jun 2026

Hybrid ClojureScript: un lenguaje que combina código textual y visual

Los lenguajes de programación dominantes obligan a los desarrolladores a expresar ideas geométricas de dominio específico únicamente mediante texto lineal. Un artículo reciente propone una solución: lenguajes híbridos que permitan crear construcciones sintácticas visuales combinables con el código t

24 Jun 2026

Un artículo revisado por pares cuestiona las afirmaciones cuánticas de Microsoft

Una crítica publicada en Nature el miércoles pone en entredicho la tecnología básica del chip de computación cuántica Majorana 1, presentado por Microsoft en febrero de 2025 como un avance basado en un tipo inédito de cúbit, el cúbit topológico. El físico Henry Legg, de la Universidad de St Andrews,

24 Jun 2026

Self-Harness: un paradigma para que los agentes LLM mejoren su propio arnés operativo

Self-Harness es un nuevo paradigma de investigación en inteligencia artificial según el cual un agente basado en modelos de lenguaje grandes (LLM) puede mejorar de forma autónoma el arnés —el software intermediario— que regula su interacción con el entorno, sin necesidad de ingenieros humanos ni de

23 Jun 2026

Argumentan que los agentes de IA ya pueden reemplazar la revisión humana de código

Un artículo publicado en arXiv sostiene que los agentes de programación —sistemas autónomos basados en modelos de lenguaje de gran tamaño capaces de leer, escribir, probar y reparar software— han superado un umbral de capacidad que vuelve innecesaria la revisión de código tradicional realizada por p

23 Jun 2026

Lift4D: reconstruir objetos dinámicos en 4D a partir de vídeo monocular

Lift4D es un marco de optimización en tiempo de prueba que reconstruye objetos dinámicos completos a partir de un único vídeo monocular, abordando un problema clásico de la visión por computador: fusionar las pistas visuales del vídeo con priors aprendidos sobre geometría y apariencia. Los métodos a

23 Jun 2026

La maldición de la inversión: los LLM no generalizan relaciones bidireccionales

Un estudio de investigación identifica una limitación estructural de los modelos de lenguaje autorregresivos (LLM), bautizada como la «maldición de la inversión». El fenómeno consiste en que, cuando un modelo se entrena con una frase del tipo «A es B», no generaliza automáticamente a la forma invers

23 Jun 2026

Baidu presenta Unlimited-OCR, un modelo de código abierto para解析 de documentos de una sola pasada y horizonte largo

Unlimited-OCR es un proyecto de código abierto desarrollado por Baidu que avanza la tarea de reconocimiento óptico de caracteres (OCR) sobre documentos completos con el objetivo de alcanzar el parsing de horizonte largo en una sola pasada, tomando como referencia DeepSeek-OCR. El repositorio ofrece

23 Jun 2026

La maldición de la inversión: los LLM no generalizan relaciones simétricas

Un equipo de investigación ha documentado una limitación sistemática en los grandes modelos de lenguaje autorregresivos: la bautizada como "maldición de la inversión". El fenómeno consiste en que, cuando un modelo se entrena con frases del tipo "A es B", no generaliza automáticamente hacia la direcc

23 Jun 2026

VibeThinker-3B: razonamiento verificable en modelos pequeños de 3.000 millones de parámetros

Investigadores presentan VibeThinker-3B, un modelo denso de 3.000 millones de parámetros diseñado para explorar los límites del razonamiento verificable en modelos de lenguaje de tamaño reducido. El trabajo, publicado como informe técnico en arXiv, parte de la premisa de que las tareas de razonamien

22 Jun 2026

PivCo-Huffman: paralelismo en descodificación Huffman sin multiplicar flujos de bits

La descodificación de Huffman es, por naturaleza, una operación secuencial. Para extraer paralelismo, las técnicas habituales recurren a dividir la entrada en varios flujos independientes, intercalar los bits de muchos flujos lógicos en uno solo (como hace GDeflate en GPUs), o descodificar de forma

22 Jun 2026

Moebius: un modelo de inpainting ligero de 0.2B que rivaliza con sistemas de 10B parámetros

Moebius es un nuevo marco de inpainting de imágenes que combina un tamaño reducido, 0.2B de parámetros, con un rendimiento comparable al de modelos de 10B. La herramienta está dirigida a investigadores y desarrolladores que necesitan completar o restaurar regiones faltantes en imágenes sin requerir

18 Jun 2026

Cómo mezclar bien una baraja: el nuevo teorema que generaliza las siete barajadas perfectas

En 1992, Dave Bayer y Persi Diaconis demostraron que siete barajadas en riffle —el clásico corte en dos montones e intercalado de cartas— bastan para mezclar una baraja de 52 cartas. Su resultado, célebre por su dificultad técnica, describía un fenómeno de corte (cutoff): al principio la baraja cons

17 Jun 2026

La gravedad semiclásica resolvería problemas NP-completos en tiempo polinómico

Un artículo reciente subido a arXiv (gr-qc, junio de 2026) explora una consecuencia sorprendente de la gravedad semiclásica: su capacidad para resolver problemas NP-completos en tiempo polinómico. El trabajo parte de dos hipótesis: que el campo gravitatorio es clásico y que se acopla a campos cuánti

09 Jun 2026

La aberración de coma como firma de transitorios rápidos en placas fotográficas de Palomar

Un equipo de astrofísicos ha propuesto un método original para distinguir imágenes astronómicas auténticas de artefactos en las placas fotográficas de los sondeos del cielo de Palomar, llevados a cabo en la década de 1950. La investigación se centra en la detección de transitorios rápidos, señales l

09 Jun 2026

Los LLM no superan a los optimizadores clásicos de hiperparámetros, según un estudio comparativo

Un estudio publicado en arXiv evalúa si los modelos de lenguaje grandes (LLM) pueden sustituir a los algoritmos clásicos de optimización de hiperparámetros (HPO) en el entrenamiento de modelos pequeños. Los autores utilizan el repositorio autoresearch, que permite a un agente LLM editar el código de

09 Jun 2026

¿Basta con grep? Un estudio compara estrategias de búsqueda en agentes de LLM

Un estudio empírico reciente, publicado en arXiv, examina de forma sistemática cómo la elección de la estrategia de recuperación de información interactúa con la arquitectura del agente y el paradigma de invocación de herramientas en sistemas de búsqueda agentic basados en modelos de lenguaje de gra

09 Jun 2026

Una introducción al análisis funcional para ciencia e ingeniería

El análisis funcional es la rama de las matemáticas que extiende el álgebra lineal más allá de las matrices finitas, permitiendo operar con conjuntos infinitos de funciones continuas. Su utilidad resulta decisiva en física e ingeniería, por ejemplo en el estudio de ondas en medios continuos, donde s

07 Jun 2026

Modelo de difusión sin entrenamiento para generar imágenes a partir de una sola referencia

Un equipo de investigación presenta un método para generar imágenes cuya estructura interna coincide con la de una imagen de referencia, sin necesidad de entrenar una red neuronal. La técnica, descrita en un artículo depositado en arXiv, se basa en construir un conjunto de datos a partir de los parc

07 Jun 2026

Revisión de código: principal sumidero de tokens en sistemas multiagente de IA

Un estudio reciente publicado en arXiv, titulado "Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering", cuantifica por primera vez de forma sistemática dónde se consume el presupuesto de cómputo de los sistemas multiagente basados en modelos de lenguaje de gran tamaño (LLM-

06 Jun 2026

Crean en Leipzig un benchmark de matemáticas avanzadas para evaluar a los LLM

Un equipo de 49 matemáticos elaboró un conjunto de 100 preguntas de matemáticas a nivel de investigación con respuestas conocidas, en el marco del taller “Benchmarks in Leipzig”, celebrado entre el 1 de abril y el 15 de mayo de 2026. La mayor parte del trabajo se concentró en un taller de tres días

05 Jun 2026

Estudio empírico revela que la blockchain Pearl no realiza inferencia de IA

Una investigación sometida a arXiv el 3 de junio de 2026 examina empíricamente a Pearl, una blockchain de capa 1 respaldada públicamente por figuras relevantes del sector de la inteligencia artificial. El trabajo cuantifica, por primera vez, la distancia entre lo que la red promete y lo que realment

02 Jun 2026

Resuelto con computación clásica un problema clave de la enzima nitrogenasa, sin necesidad de ordenador cuántico

Un equipo de seis químicos cuánticos del Instituto de Tecnología de California (Caltech) alcanzó en enero un hito en la comprensión de la enzima nitrogenasa, que convierte el nitrógeno atmosférico en amoniaco, utilizando exclusivamente métodos computacionales clásicos. El avance, encabezado por Garn

31 May 2026

Rotary GPU: ejecución local de modelos MoE con memoria GPU limitada

Rotary GPU es un enfoque de ejecución local para modelos grandes de mezcla de expertos (MoE) que permite correrlos en hardware de consumo con memoria limitada. Desarrollado a partir del concepto de residencia en aceleradores rotatorios, el método fue validado públicamente con el modelo Qwen3.6-35B-A

08 May 2026

IA alucina: ¿por qué ChatGPT inventa información?

El rápido avance de los modelos de lenguaje grandes (LLMs), como ChatGPT, ha generado una gran expectación, pero también una preocupación persistente: las “alucinaciones”. En términos sencillos, una alucinación en un LLM es cuando el modelo genera información incorrecta o inventada, presentándola co

24 Apr 2026

HN: Investigación de LLM pierde interés

Un análisis reciente realizado por Dylan Castillo revela una disminución en la presencia de investigaciones sobre modelos de lenguaje grandes (LLM) en Hacker News (HN), una plataforma popular entre programadores y entusiastas de la tecnología. Utilizando a Claude, un asistente de IA, Castillo rastre

13 Apr 2026

Matemáticas esenciales: funciones básicas con solo dos elementos

El artículo de Andrzej Odrzywolek, publicado en arXiv, presenta un concepto fascinante: el 'minimalismo matemático'. En esencia, demuestra que es posible construir todas las funciones elementales (como exponenciales, trigonométricas, raíces cuadradas, etc.) a partir de un conjunto extremadamente red

10 Mar 2026

Experto cuestiona algoritmo cuántico y su impacto en seguridad

Un experto en computación cuántica, Scott Aaronson, ha desacreditado un algoritmo recientemente anunciado llamado “JVG” (Jesse–Victor–Gharabaghi), que se promocionaba como una mejora significativa sobre el algoritmo de Shor para la factorización. El algoritmo JVG, presentado en Preprints.org, afirma

08 Mar 2026

Código simple da origen a vida artificial

Un investigador ha recreado un experimento de vida artificial autorreplicante utilizando un código relativamente simple de aproximadamente 300 líneas, basado en el estudio "Computational Life" publicado recientemente en arXiv. El experimento, implementado en una cuadrícula de 240x135, inicializa ale

04 Mar 2026

IA acelera matemáticas: LLMs automatizan topología

Un proyecto de investigación ha logrado automatizar una porción significativa de la topología general, un campo complejo de las matemáticas, utilizando modelos de lenguaje grandes (LLMs). Según un estudio publicado en arXiv el 6 de enero de 2026, el equipo liderado por Josef Urban ha formalizado apr

02 Mar 2026

ia: modelos de lenguaje esconden 'personalidades'

Este artículo de investigación explora un descubrimiento fascinante sobre cómo funcionan los modelos de lenguaje grandes (LLMs). Tradicionalmente, se ha creído que los LLMs adoptan diferentes 'personalidades' o comportamientos a través de técnicas externas como el ajuste fino, el uso de indicaciones

25 Feb 2026

Auge de preimpresiones: ¿cambio en la física teórica?

Un análisis reciente publicado en math.columbia.edu sugiere un posible cambio radical en la producción de artículos científicos, particularmente en el campo de la física teórica de altas energías (hep-th). El autor, quien permanece anónimo, ha observado un aumento significativo en el número de envío

21 Feb 2026

Crítica desata debate sobre arquitectura de GPU NVIDIA

Este documento es una crítica contundente a un artículo titulado "Microbenchmarking NVIDIA’s Blackwell Architecture: An in-depth Architectural Analysis", publicado en arXiv. La crítica, escrita por Sophia Wisdom, argumenta que el artículo es fundamentalmente defectuoso y carece de sentido técnico. E

21 Feb 2026

ia: modelos fallan en razonamiento simple

Los Modelos de Lenguaje Grandes (LLMs), como GPT-4 o Gemini, han demostrado una capacidad asombrosa para razonar y resolver problemas, logrando resultados impresionantes en diversas tareas. Sin embargo, a pesar de estos avances, persisten fallos de razonamiento significativos, incluso en escenarios

18 Feb 2026

DeepMind crea IA de ajedrez sin búsquedas complejas

DeepMind ha desarrollado un nuevo modelo de ajedrez basado en transformadores que alcanza un nivel de juego comparable al de un Gran Maestro humano, según un estudio reciente publicado en arXiv. El modelo, entrenado utilizando datos de Stockfish, predice el valor de una posición, el valor de realiza

10 Feb 2026

IA: ¿Singularidad en 2026? Un análisis predice el martes

Un análisis predictivo, aunque autodenominado "desenfrenado", sugiere que la "singularidad" (un punto de cambio radical impulsado por la IA) ocurrirá el martes 10 de febrero de 2026. El autor, utilizando métricas como los puntajes MMLU, el costo por token, los intervalos de lanzamiento de nuevas ver

08 Feb 2026

Ciencia encuentra patrones matemáticos convergentes

Un nuevo estudio, publicado en arXiv y respaldado por Didier Sornette de la ETH Zurich, revela un patrón convergente en diversas disciplinas científicas (física, biología, finanzas, ingeniería) que han desarrollado de forma independiente herramientas matemáticas para predecir puntos de inflexión en

07 Feb 2026

IA al límite: Evalúan su capacidad en matemáticas avanzadas

Un nuevo estudio, publicado en arXiv, evalúa la capacidad de los sistemas de inteligencia artificial actuales para responder preguntas de investigación matemática de nivel avanzado. Los autores han creado un conjunto de diez preguntas que surgieron durante su propio proceso de investigación, las cua

07 Feb 2026

RLHF: Guía para el Aprendizaje con Retroalimentación Humana

Este documento presenta un libro introductorio sobre el aprendizaje por refuerzo con retroalimentación humana (RLHF), una técnica crucial para el despliegue de sistemas de aprendizaje automático de última generación. El libro explora los orígenes de RLHF, desde la literatura reciente hasta la conver