HuggingFace

10 Feb 2026

Reconocimiento de Voz Directo en el Navegador: ¡Sin Servidor!

Desarrolladores han logrado ejecutar un modelo de reconocimiento de voz de Mistral AI, Voxtral Mini 4B Realtime, directamente en el navegador web, eliminando la necesidad de un servidor externo. Esta hazaña, impulsada por Rust y el framework Burn, permite la transcripción de audio en tiempo real uti

11 Feb 2026

GLM-OCR: Nuevo OCR de Código Abierto Lidera en Precisión

Investigadores han desarrollado GLM-OCR, un nuevo modelo de código abierto para el reconocimiento óptico de caracteres (OCR) que alcanza un rendimiento de vanguardia en la comprensión de documentos complejos. Basado en la arquitectura GLM-V encoder-decoder, GLM-OCR incorpora técnicas innovadoras com

25 Feb 2026

Capybara: IA de código abierto revoluciona la creación visual

Investigadores han presentado 'Capybara', un nuevo modelo de inteligencia artificial de código abierto diseñado para la generación y edición visual de alta calidad. Lanzado recientemente (el 17 de febrero de 2026), Capybara combina arquitecturas de difusión avanzadas y transformadores para ofrecer v

26 Feb 2026

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

06 Mar 2026

Obliteratus: elimina filtros de IA sin reentrenar

Un nuevo toolkit de código abierto llamado 'Obliteratus' ha sido lanzado para eliminar comportamientos de rechazo en modelos de lenguaje grandes (LLMs). Desarrollado por Elder-Plinius y disponible en Hugging Face Spaces, Obliteratus utiliza técnicas de 'abliterator' para identificar y remover las re

08 Mar 2026

Microsoft lanza IA multimodal: Phi-4 razona con imágenes

Microsoft ha lanzado Phi-4-Vision-Reasoning-15B, un nuevo modelo de inteligencia artificial multimodal de código abierto con 15 mil millones de parámetros. Este modelo destaca por su equilibrio entre capacidad de razonamiento, eficiencia y requisitos de datos de entrenamiento, permitiendo una intera

10 Mar 2026

IA sorprende: modelo líder sin ajustes

En un giro inesperado en el mundo de la inteligencia artificial, un investigador conocido como 'dnhkng' ha logrado colocar su modelo, 'RYS-XLarge', en la cima del Hugging Face Open LLM Leaderboard, sin modificar ni un solo peso del modelo original. La hazaña, lograda a mediados de 2024, implica dupl

10 Mar 2026

Entrenar IA de código abierto: desafíos inesperados

Un ingeniero de Workshop Labs, Addie Foote, relata los desafíos encontrados al intentar entrenar y servir modelos de lenguaje grandes con pesos abiertos, específicamente el modelo Kimi-K2-Thinking de Moonshot AI. El objetivo era post-entrenar el modelo, que cuenta con 1 billón de parámetros y está c

11 Mar 2026

IA optimiza GPUs: nuevo agente agiliza el rendimiento

RightNow AI ha presentado AutoKernel, un agente de inteligencia artificial que automatiza la optimización de kernels de GPU, inspirándose en el trabajo de autoresearch de Andrej Karpathy. AutoKernel toma cualquier modelo PyTorch, identifica los kernels de cuello de botella, los optimiza de forma aut

13 Mar 2026

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

20 Mar 2026

Mapas revelan dónde está el valor en las ciudades

Este artículo del Center for Land Economics explora una estrategia poderosa para la defensa del urbanismo: visualizar datos de valor de la tierra en mapas. La idea central es que la mayoría de las personas tienen una percepción errónea de dónde se concentra el valor económico en las ciudades. El art

31 Mar 2026

Mr. Chatterbox: IA con sabor victoriano

Trip Venturella ha lanzado "Mr. Chatterbox", un modelo de lenguaje único que se entrena exclusivamente con textos de dominio público de la Biblioteca Británica, datados entre 1837 y 1899. Este enfoque elimina cualquier dato de entrenamiento posterior a 1899, creando un modelo con una perspectiva y v

31 Mar 2026

Cohere lanza modelo de voz de alta precisión

Cohere ha lanzado Transcribe, un modelo de reconocimiento automático de voz (ASR) de última generación y de código abierto, disponible para descarga desde Hugging Face. El objetivo de Cohere fue crear un modelo preciso y listo para uso práctico, minimizando la tasa de error de palabra (WER). Transcr

01 Apr 2026

SwiftLM: LLMs nativos y rápidos en Apple Silicon

Un equipo de desarrolladores ha lanzado SwiftLM, un servidor de inferencia nativo para dispositivos Apple Silicon que ofrece compatibilidad con la API de OpenAI. Esta herramienta, de código abierto, elimina la necesidad de un entorno de ejecución de Python y el Global Interpreter Lock (GIL), lo que

06 Apr 2026

GuppyLM: IA accesible para todos en 5 minutos

Un investigador ha desarrollado "GuppyLM", un modelo de lenguaje pequeño (aproximadamente 9 millones de parámetros) que imita la personalidad de un pez llamado Guppy. El proyecto, disponible en GitHub, busca demostrar que el entrenamiento de modelos de lenguaje no requiere conocimientos avanzados ni

12 Apr 2026

IA se auto-optimiza y supera expectativas

MiniMax ha desarrollado M2.7, un modelo de inteligencia artificial que se ha mejorado a sí mismo de forma autónoma, logrando resultados impresionantes en pruebas de referencia. En un proceso sin intervención humana directa, el modelo analizó sus propios fallos, modificó su código y optimizó su rendi

20 Apr 2026

Trellis-2: Modelado 3D ahora en Macs Apple Silicon

Microsoft's vanguardia imagen-a-modelo 3D, TRELLIS.2, puede ahora ejecutarse de forma nativa en Macs con Apple Silicon sin necesidad de una GPU NVIDIA, gracias a una adaptación desarrollada por Shivampkumar y publicada en GitHub. Este desarrollo significativo aprovecha PyTorch MPS, permitiendo a los

24 Apr 2026

DeepSeek-V4: IA procesa textos extensos sin problemas

DeepSeek-V4 es una nueva generación de modelos de lenguaje de gran escala (LLM) desarrollados por DeepSeek AI, que se destacan por su capacidad para procesar contextos extremadamente largos, hasta un millón de tokens. Esto representa un avance significativo, ya que la mayoría de los LLM tradicionale

24 Apr 2026

TIPSv2: Modelo mejora la unión de imagen y texto

TIPSv2 representa una nueva generación de modelos de codificación de imágenes y texto, diseñados para mejorar el rendimiento en una amplia gama de tareas multimodales y de visión artificial. El núcleo de la innovación reside en una observación sorprendente: la destilación (un proceso de aprendizaje

25 Apr 2026

VT Code: Nuevo asistente de código abierto facilita el desarrollo

Un nuevo agente de codificación de código abierto llamado VT Code ha sido lanzado, con el objetivo de simplificar el desarrollo de software. Desarrollado por Vinhnx y disponible en GitHub, VT Code ofrece comprensión nativa del código con modelos de lenguaje grandes (LLM) y robustez en la seguridad d

10 May 2026

IA local en Macs: Qwen 3.5 logra 40 tokens por segundo con chip M4

Investigadores y desarrolladores ahora pueden ejecutar modelos de inteligencia artificial localmente en Macs con chip M4 y 24 GB de memoria, reduciendo la dependencia de las grandes tecnológicas. La autora Johanna Larsson probó varias herramientas como Ollama, Llama.cpp y LM Studio, encontrando que

14 May 2026

GGUF: el formato que unifica todos los componentes de modelos de lenguaje en un solo archivo

GGUF es el formato de archivo utilizado por llama.cpp para almacenar modelos de lenguaje. Su principal ventaja es que concatena en un único archivo todos los componentes necesarios: plantillas de chat, tokens especiales y configuración del muestreador. Las plantillas de chat usan el lenguaje Jinja2

15 May 2026

Nueva herramienta encuentra el mejor LLM para tu hardware

El desarrollador Andyyyy64 ha publicado en GitHub la herramienta 'whichllm', diseñada para ayudar a los usuarios a encontrar el modelo de lenguaje grande (LLM) más adecuado para su hardware específico. La aplicación detecta automáticamente las características del sistema (GPU, CPU, RAM) y ordena los

16 May 2026

Presentan Orthrus, framework que multiplica por 7,8 la velocidad en generación de texto con IA

Se ha presentado Orthrus, un nuevo framework de inteligencia artificial que combina la precisión de los modelos de lenguaje grandes autoregresivos con la velocidad de generación paralela de los modelos de difusión. El sistema, desarrollado por el investigador Chiennv y disponible en HuggingFace, log

16 May 2026

Librería PyTorch permite analizar Hessian de redes neuronales grandes sin alta memoria

Un nuevo módulo de Python llamado 'hessian-eigenthings' permite analizar la matriz Hessian de redes neuronales grandes sin requerir memoria cuadrática. Desarrollado por Noah Golmant en colaboración con investigadores de UC Berkeley, esta biblioteca calcula la eigendecomposición del Hessian usando mé

22 May 2026

Nueva librería KVBoost permite ejecutar LLMs grandes con poca VRAM

KVBoost es una nueva librería de código abierto desarrollada por el repositorio Pythongiant que acelera significativamente la inferencia de grandes modelos de lenguaje (LLM) reduciendodrásticamente los requisitos de memoria VRAM. La herramienta解决los principales problemas de rendimiento: los modelos

31 May 2026

Herramienta de IA de código abierto crea vídeos cortos en HD

MoneyPrinterTurbo es una herramienta de código abierto que integra grandes modelos de lenguaje (LLM) para generar vídeos cortos de alta definición de forma automatizada. Su arquitectura sigue el patrón MVC, lo que facilita su mantenimiento y escalabilidad, y ofrece tanto una interfaz web como una AP

31 May 2026

Foursquare presenta un nuevo portal para su base de datos Places de código abierto

Foursquare anunció la transición de su conjunto de datos Places de código abierto (FSQ OS Places) desde un acceso público mediante bucket S3 a un nuevo portal centralizado, disponible a partir de octubre de 2025. La empresa, que lanzó el dataset en noviembre de 2024 con un enfoque comunitario, repor

01 Jun 2026

MiniMax lanza M3 con un millón de tokens de contexto y multimodocidad nativa

MiniMax, la empresa china de inteligencia artificial, ha presentado M3, un nuevo modelo de IA de pesos abiertos que combina capacidades de programación de frontera y agentic con una ventana de contexto de hasta un millón de tokens y multimodocidad nativa. Según la compañía, M3 es el primer modelo de

03 Jun 2026

@lateos/npm-scan: análisis estático y conductual para la cadena de suministro de npm

@lateos/npm-scan es una herramienta de seguridad de código abierto que realiza análisis estático y conductual sobre paquetes del ecosistema npm —y, parcialmente, de PyPI— para detectar amenazas avanzadas en la cadena de suministro de software. A diferencia de npm audit, Snyk o Socket, la herramienta

05 Jun 2026

Dr. GRPO: un kernel 2,2× más rápido en test, 3× más lento integrado

Este artículo describe el proceso de construir, desde cero, un bucle de entrenamiento de aprendizaje por refuerzo (RL) para modelos de lenguaje grandes, aplicándolo al algoritmo Dr. GRPO sobre el modelo Qwen2.5-0.5B-Instruct y la tarea GSM8K, con una sola GPU A10G. El punto de partida es una observa

Noticias que mencionan HuggingFace