16 May 2026 · Original en inglés · Resumen IA

Presentan Orthrus, framework que multiplica por 7,8 la velocidad en generación de texto con IA

Fuentes: New Orthrus framework accelerates LLM inference with lossless generation

Se ha presentado Orthrus, un nuevo framework de inteligencia artificial que combina la precisión de los modelos de lenguaje grandes autoregresivos con la velocidad de generación paralela de los modelos de difusión. El sistema, desarrollado por el investigador Chiennv y disponible en HuggingFace, logra hasta 7,8 veces más velocidad en la generación de texto sin perder calidad. Los modelos Orthrus utilizan Qwen3 como base (1.7B, 4B y 8B parámetros) y garantizan generación estrictamente sin pérdidas mediante un mecanismo de consenso intra-modelo. El framework solo requiere afinar el 16% de los parámetros totales, manteniendo el modelo base congelado. La tecnología supera a métodos especulativos como EAGLE-3 y DFlash, ofreciendo mayor tasa de aceptación de tokens y tiempos de inferencia más rápidos, especialmente cuando aumenta la longitud del contexto. Orthrus representa un avance significativo en la resolución del cuello de botella secuencial que caracteriza a los LLMs tradicionales.

Temas

Etiquetas

inteligencia artificial modelos de lenguaje machine learning deep learning orthrus qwen3 huggingface chiennv inferencia modelos de difusión

Entidades mencionadas

Transformers software

vLLM software

Torch software

Qwen3 software

AutoTokenizer software

AutoModelForCausalLM software

Orthrus software

EAGLE-3 software

DFlash software

MATH-500 event

Fast-dLLM-v2 software

Chaitra Hegde person

Senior Data Scientist, Walmart | PhD, Georgia Tech · Experience: Walmart Global Tech · Education: Georgia Institute of Technology · Location: United States · 500+ connections on LinkedIn.

chiennv person

Chien-Shiung Wu fue una física estadounidense nacida en China experta en radiactividad. Wu trabajó en el Proyecto Manhattan, donde contribuyó a desarrollar el proceso para separar el uranio metálico e

Ver en Wikipedia

Chien Van Nguyen person

Van Chien Nguyen ➤ former footballer from Vietnam ➤ Midfield ➤ last club: ? ➤ * 17.08.1993 in ,

Van Cuong Pham person

Van Cuong Pham, 34, from Vietnam ➤ SHB Da Nang FC, since 2022 ➤ Goalkeeper ➤ Market value: - ➤ * Jul 19, 1990 in ,

Ryan A. Rossi person

Ryan Aronin es un médico estadounidense certificado en Medicina Interna que sirve en la facultad de la Facultad de Medicina David Geffen de la Universidad de California en Los Ángeles. Él en particula

Ver en Wikipedia

Franck Dernoncourt person

Franck Dernoncourt · NLP/ML Researcher. MIT PhD. Verified email at mit.edu - Homepage · Machine LearningNeural NetworksNatural Language Processing · ArticlesCited byPublic accessCo-authors · PrivacyTe

Thien Huu Nguyen person

Thien Huu Nguyen · University of Oregon · Verified email at cs.uoregon.edu - Homepage · Information ExtractionDeep LearningNatural Language ProcessingMachine Learning · ArticlesCited byPublic accessCo

diffusion models software

arXiv organization

arXiv es un archivo en línea para las prepublicaciones de artículos científicos en el campo de las matemáticas, física, ciencias de la computación y biología cuantitativa. En muchos campos de las mate

Ver en Wikipedia

HuggingFace organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

SGLang software

LLMs software

Llissá de Vall es un municipio de la comarca del Vallés Oriental situado en la Vall del Tenes y el límite de la llanura de Granollers.

Enlaces

🤗 HuggingFace web.archive.org

paper web.archive.org