arXiv se independiza de la Universidad de Cornell el 1 de julio de 2026

El repositorio de preprints científicos arXiv dejará de depender de la Universidad de Cornell el 1 de julio de 2026, cuando se constituya como organización sin ánimo de lucro independiente tras 25 años de vinculación con la institución académica. El cambio, que se venía gestando desde hace tiempo, a

Una guía técnica reconstruye por ingeniería inversa el Apple Neural Engine

El Apple Neural Engine (ANE) es el acelerador de matriz de función fija integrado en los chips de la casa desde el SoC A11 (iPhone y iPad) y la familia M1 (Mac), al que las aplicaciones sólo acceden a través del framework Core ML. Una nueva guía técnica, depositada en arXiv por Spencer Bryngelson, o

Proxy-KD: destilar conocimiento de modelos de lenguaje cerrados

Investigadores presentan Proxy-KD, un método de destilación de conocimiento diseñado para transferir el saber de grandes modelos de lenguaje (LLM) propietarios y opacos —como GPT-4— a modelos más pequeños y ligeros. La destilación de conocimiento tradicional requiere acceder a los estados internos d

Una revista retracta por error dos artículos de Max Planck de los años 40

Dos historiadores de la física han descubierto que la revista Naturwissenschaften, ahora llamada The Science of Nature, ha retirado sin explicación dos artículos publicados por el físico alemán Max Planck —premio Nobel de Física en 1918 por su descubrimiento de los cuantos— en la década de 1940. Los

Hybrid ClojureScript: un lenguaje que combina código textual y visual

Los lenguajes de programación dominantes obligan a los desarrolladores a expresar ideas geométricas de dominio específico únicamente mediante texto lineal. Un artículo reciente propone una solución: lenguajes híbridos que permitan crear construcciones sintácticas visuales combinables con el código t

Lift4D: reconstruir objetos dinámicos en 4D a partir de vídeo monocular

Lift4D es un marco de optimización en tiempo de prueba que reconstruye objetos dinámicos completos a partir de un único vídeo monocular, abordando un problema clásico de la visión por computador: fusionar las pistas visuales del vídeo con priors aprendidos sobre geometría y apariencia. Los métodos a

La maldición de la inversión: los LLM no generalizan relaciones bidireccionales

Un estudio de investigación identifica una limitación estructural de los modelos de lenguaje autorregresivos (LLM), bautizada como la «maldición de la inversión». El fenómeno consiste en que, cuando un modelo se entrena con una frase del tipo «A es B», no generaliza automáticamente a la forma invers

La maldición de la inversión: los LLM no generalizan relaciones simétricas

Un equipo de investigación ha documentado una limitación sistemática en los grandes modelos de lenguaje autorregresivos: la bautizada como "maldición de la inversión". El fenómeno consiste en que, cuando un modelo se entrena con frases del tipo "A es B", no generaliza automáticamente hacia la direcc

¿Basta con grep? Un estudio compara estrategias de búsqueda en agentes de LLM

Un estudio empírico reciente, publicado en arXiv, examina de forma sistemática cómo la elección de la estrategia de recuperación de información interactúa con la arquitectura del agente y el paradigma de invocación de herramientas en sistemas de búsqueda agentic basados en modelos de lenguaje de gra

Una introducción al análisis funcional para ciencia e ingeniería

El análisis funcional es la rama de las matemáticas que extiende el álgebra lineal más allá de las matrices finitas, permitiendo operar con conjuntos infinitos de funciones continuas. Su utilidad resulta decisiva en física e ingeniería, por ejemplo en el estudio de ondas en medios continuos, donde s

Crean en Leipzig un benchmark de matemáticas avanzadas para evaluar a los LLM

Un equipo de 49 matemáticos elaboró un conjunto de 100 preguntas de matemáticas a nivel de investigación con respuestas conocidas, en el marco del taller “Benchmarks in Leipzig”, celebrado entre el 1 de abril y el 15 de mayo de 2026. La mayor parte del trabajo se concentró en un taller de tres días

Estudio empírico revela que la blockchain Pearl no realiza inferencia de IA

Una investigación sometida a arXiv el 3 de junio de 2026 examina empíricamente a Pearl, una blockchain de capa 1 respaldada públicamente por figuras relevantes del sector de la inteligencia artificial. El trabajo cuantifica, por primera vez, la distancia entre lo que la red promete y lo que realment

Rotary GPU: ejecución local de modelos MoE con memoria GPU limitada

Rotary GPU es un enfoque de ejecución local para modelos grandes de mezcla de expertos (MoE) que permite correrlos en hardware de consumo con memoria limitada. Desarrollado a partir del concepto de residencia en aceleradores rotatorios, el método fue validado públicamente con el modelo Qwen3.6-35B-A

IA alucina: ¿por qué ChatGPT inventa información?

El rápido avance de los modelos de lenguaje grandes (LLMs), como ChatGPT, ha generado una gran expectación, pero también una preocupación persistente: las “alucinaciones”. En términos sencillos, una alucinación en un LLM es cuando el modelo genera información incorrecta o inventada, presentándola co

HN: Investigación de LLM pierde interés

Un análisis reciente realizado por Dylan Castillo revela una disminución en la presencia de investigaciones sobre modelos de lenguaje grandes (LLM) en Hacker News (HN), una plataforma popular entre programadores y entusiastas de la tecnología. Utilizando a Claude, un asistente de IA, Castillo rastre

Matemáticas esenciales: funciones básicas con solo dos elementos

El artículo de Andrzej Odrzywolek, publicado en arXiv, presenta un concepto fascinante: el 'minimalismo matemático'. En esencia, demuestra que es posible construir todas las funciones elementales (como exponenciales, trigonométricas, raíces cuadradas, etc.) a partir de un conjunto extremadamente red

Experto cuestiona algoritmo cuántico y su impacto en seguridad

Un experto en computación cuántica, Scott Aaronson, ha desacreditado un algoritmo recientemente anunciado llamado “JVG” (Jesse–Victor–Gharabaghi), que se promocionaba como una mejora significativa sobre el algoritmo de Shor para la factorización. El algoritmo JVG, presentado en Preprints.org, afirma

Código simple da origen a vida artificial

Un investigador ha recreado un experimento de vida artificial autorreplicante utilizando un código relativamente simple de aproximadamente 300 líneas, basado en el estudio "Computational Life" publicado recientemente en arXiv. El experimento, implementado en una cuadrícula de 240x135, inicializa ale

IA acelera matemáticas: LLMs automatizan topología

Un proyecto de investigación ha logrado automatizar una porción significativa de la topología general, un campo complejo de las matemáticas, utilizando modelos de lenguaje grandes (LLMs). Según un estudio publicado en arXiv el 6 de enero de 2026, el equipo liderado por Josef Urban ha formalizado apr

ia: modelos de lenguaje esconden 'personalidades'

Este artículo de investigación explora un descubrimiento fascinante sobre cómo funcionan los modelos de lenguaje grandes (LLMs). Tradicionalmente, se ha creído que los LLMs adoptan diferentes 'personalidades' o comportamientos a través de técnicas externas como el ajuste fino, el uso de indicaciones

Auge de preimpresiones: ¿cambio en la física teórica?

Un análisis reciente publicado en math.columbia.edu sugiere un posible cambio radical en la producción de artículos científicos, particularmente en el campo de la física teórica de altas energías (hep-th). El autor, quien permanece anónimo, ha observado un aumento significativo en el número de envío

Crítica desata debate sobre arquitectura de GPU NVIDIA

Este documento es una crítica contundente a un artículo titulado "Microbenchmarking NVIDIA’s Blackwell Architecture: An in-depth Architectural Analysis", publicado en arXiv. La crítica, escrita por Sophia Wisdom, argumenta que el artículo es fundamentalmente defectuoso y carece de sentido técnico. E

ia: modelos fallan en razonamiento simple

Los Modelos de Lenguaje Grandes (LLMs), como GPT-4 o Gemini, han demostrado una capacidad asombrosa para razonar y resolver problemas, logrando resultados impresionantes en diversas tareas. Sin embargo, a pesar de estos avances, persisten fallos de razonamiento significativos, incluso en escenarios

DeepMind crea IA de ajedrez sin búsquedas complejas

DeepMind ha desarrollado un nuevo modelo de ajedrez basado en transformadores que alcanza un nivel de juego comparable al de un Gran Maestro humano, según un estudio reciente publicado en arXiv. El modelo, entrenado utilizando datos de Stockfish, predice el valor de una posición, el valor de realiza

IA: ¿Singularidad en 2026? Un análisis predice el martes

Un análisis predictivo, aunque autodenominado "desenfrenado", sugiere que la "singularidad" (un punto de cambio radical impulsado por la IA) ocurrirá el martes 10 de febrero de 2026. El autor, utilizando métricas como los puntajes MMLU, el costo por token, los intervalos de lanzamiento de nuevas ver

Ciencia encuentra patrones matemáticos convergentes

Un nuevo estudio, publicado en arXiv y respaldado por Didier Sornette de la ETH Zurich, revela un patrón convergente en diversas disciplinas científicas (física, biología, finanzas, ingeniería) que han desarrollado de forma independiente herramientas matemáticas para predecir puntos de inflexión en

IA al límite: Evalúan su capacidad en matemáticas avanzadas

Un nuevo estudio, publicado en arXiv, evalúa la capacidad de los sistemas de inteligencia artificial actuales para responder preguntas de investigación matemática de nivel avanzado. Los autores han creado un conjunto de diez preguntas que surgieron durante su propio proceso de investigación, las cua

RLHF: Guía para el Aprendizaje con Retroalimentación Humana

Este documento presenta un libro introductorio sobre el aprendizaje por refuerzo con retroalimentación humana (RLHF), una técnica crucial para el despliegue de sistemas de aprendizaje automático de última generación. El libro explora los orígenes de RLHF, desde la literatura reciente hasta la conver