Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores creada para aplicaciones de procesamiento de lenguaje natural y su plataforma que permite a los usuarios compartir conjuntos de datos y modelos de aprendizaje automático.

Ver en Wikipedia

Noticias que mencionan HuggingFace

Nueva herramienta encuentra el mejor LLM para tu hardware

El desarrollador Andyyyy64 ha publicado en GitHub la herramienta 'whichllm', diseñada para ayudar a los usuarios a encontrar el modelo de lenguaje grande (LLM) más adecuado para su hardware específico. La aplicación detecta automáticamente las características del sistema (GPU, CPU, RAM) y ordena los

IA local en Macs: Qwen 3.5 logra 40 tokens por segundo con chip M4

Investigadores y desarrolladores ahora pueden ejecutar modelos de inteligencia artificial localmente en Macs con chip M4 y 24 GB de memoria, reduciendo la dependencia de las grandes tecnológicas. La autora Johanna Larsson probó varias herramientas como Ollama, Llama.cpp y LM Studio, encontrando que

VT Code: Nuevo asistente de código abierto facilita el desarrollo

Un nuevo agente de codificación de código abierto llamado VT Code ha sido lanzado, con el objetivo de simplificar el desarrollo de software. Desarrollado por Vinhnx y disponible en GitHub, VT Code ofrece comprensión nativa del código con modelos de lenguaje grandes (LLM) y robustez en la seguridad d

TIPSv2: Modelo mejora la unión de imagen y texto

TIPSv2 representa una nueva generación de modelos de codificación de imágenes y texto, diseñados para mejorar el rendimiento en una amplia gama de tareas multimodales y de visión artificial. El núcleo de la innovación reside en una observación sorprendente: la destilación (un proceso de aprendizaje

DeepSeek-V4: IA procesa textos extensos sin problemas

DeepSeek-V4 es una nueva generación de modelos de lenguaje de gran escala (LLM) desarrollados por DeepSeek AI, que se destacan por su capacidad para procesar contextos extremadamente largos, hasta un millón de tokens. Esto representa un avance significativo, ya que la mayoría de los LLM tradicionale

Trellis-2: Modelado 3D ahora en Macs Apple Silicon

Microsoft's vanguardia imagen-a-modelo 3D, TRELLIS.2, puede ahora ejecutarse de forma nativa en Macs con Apple Silicon sin necesidad de una GPU NVIDIA, gracias a una adaptación desarrollada por Shivampkumar y publicada en GitHub. Este desarrollo significativo aprovecha PyTorch MPS, permitiendo a los

IA se auto-optimiza y supera expectativas

MiniMax ha desarrollado M2.7, un modelo de inteligencia artificial que se ha mejorado a sí mismo de forma autónoma, logrando resultados impresionantes en pruebas de referencia. En un proceso sin intervención humana directa, el modelo analizó sus propios fallos, modificó su código y optimizó su rendi

GuppyLM: IA accesible para todos en 5 minutos

Un investigador ha desarrollado "GuppyLM", un modelo de lenguaje pequeño (aproximadamente 9 millones de parámetros) que imita la personalidad de un pez llamado Guppy. El proyecto, disponible en GitHub, busca demostrar que el entrenamiento de modelos de lenguaje no requiere conocimientos avanzados ni

SwiftLM: LLMs nativos y rápidos en Apple Silicon

Un equipo de desarrolladores ha lanzado SwiftLM, un servidor de inferencia nativo para dispositivos Apple Silicon que ofrece compatibilidad con la API de OpenAI. Esta herramienta, de código abierto, elimina la necesidad de un entorno de ejecución de Python y el Global Interpreter Lock (GIL), lo que

Cohere lanza modelo de voz de alta precisión

Cohere ha lanzado Transcribe, un modelo de reconocimiento automático de voz (ASR) de última generación y de código abierto, disponible para descarga desde Hugging Face. El objetivo de Cohere fue crear un modelo preciso y listo para uso práctico, minimizando la tasa de error de palabra (WER). Transcr

Mr. Chatterbox: IA con sabor victoriano

Trip Venturella ha lanzado "Mr. Chatterbox", un modelo de lenguaje único que se entrena exclusivamente con textos de dominio público de la Biblioteca Británica, datados entre 1837 y 1899. Este enfoque elimina cualquier dato de entrenamiento posterior a 1899, creando un modelo con una perspectiva y v

Mapas revelan dónde está el valor en las ciudades

Este artículo del Center for Land Economics explora una estrategia poderosa para la defensa del urbanismo: visualizar datos de valor de la tierra en mapas. La idea central es que la mayoría de las personas tienen una percepción errónea de dónde se concentra el valor económico en las ciudades. El art

ia: nuevos modelos redefinen el panorama tecnológico

Un panorama de modelos de inteligencia artificial está experimentando cambios significativos, según un reciente análisis de canirun.ai. Empresas como Meta, Alibaba, Microsoft, OpenAI, Google, Mistral AI, DeepSeek y NVIDIA están lanzando nuevas versiones y arquitecturas de modelos, abarcando una ampl

IA optimiza GPUs: nuevo agente agiliza el rendimiento

RightNow AI ha presentado AutoKernel, un agente de inteligencia artificial que automatiza la optimización de kernels de GPU, inspirándose en el trabajo de autoresearch de Andrej Karpathy. AutoKernel toma cualquier modelo PyTorch, identifica los kernels de cuello de botella, los optimiza de forma aut

Entrenar IA de código abierto: desafíos inesperados

Un ingeniero de Workshop Labs, Addie Foote, relata los desafíos encontrados al intentar entrenar y servir modelos de lenguaje grandes con pesos abiertos, específicamente el modelo Kimi-K2-Thinking de Moonshot AI. El objetivo era post-entrenar el modelo, que cuenta con 1 billón de parámetros y está c

IA sorprende: modelo líder sin ajustes

En un giro inesperado en el mundo de la inteligencia artificial, un investigador conocido como 'dnhkng' ha logrado colocar su modelo, 'RYS-XLarge', en la cima del Hugging Face Open LLM Leaderboard, sin modificar ni un solo peso del modelo original. La hazaña, lograda a mediados de 2024, implica dupl

Microsoft lanza IA multimodal: Phi-4 razona con imágenes

Microsoft ha lanzado Phi-4-Vision-Reasoning-15B, un nuevo modelo de inteligencia artificial multimodal de código abierto con 15 mil millones de parámetros. Este modelo destaca por su equilibrio entre capacidad de razonamiento, eficiencia y requisitos de datos de entrenamiento, permitiendo una intera

Obliteratus: elimina filtros de IA sin reentrenar

Un nuevo toolkit de código abierto llamado 'Obliteratus' ha sido lanzado para eliminar comportamientos de rechazo en modelos de lenguaje grandes (LLMs). Desarrollado por Elder-Plinius y disponible en Hugging Face Spaces, Obliteratus utiliza técnicas de 'abliterator' para identificar y remover las re

ZSE: Motor optimiza LLMs y reduce el uso de memoria

Un nuevo motor de inferencia para modelos de lenguaje grandes (LLM) llamado ZSE ha sido desarrollado para reducir drásticamente los requisitos de memoria, según un anuncio reciente en GitHub. Creado por Zyora-Dev, ZSE permite ejecutar modelos de lenguaje de gran tamaño con una huella de memoria sign

Capybara: IA de código abierto revoluciona la creación visual

Investigadores han presentado 'Capybara', un nuevo modelo de inteligencia artificial de código abierto diseñado para la generación y edición visual de alta calidad. Lanzado recientemente (el 17 de febrero de 2026), Capybara combina arquitecturas de difusión avanzadas y transformadores para ofrecer v

GLM-OCR: Nuevo OCR de Código Abierto Lidera en Precisión

Investigadores han desarrollado GLM-OCR, un nuevo modelo de código abierto para el reconocimiento óptico de caracteres (OCR) que alcanza un rendimiento de vanguardia en la comprensión de documentos complejos. Basado en la arquitectura GLM-V encoder-decoder, GLM-OCR incorpora técnicas innovadoras com

Reconocimiento de Voz Directo en el Navegador: ¡Sin Servidor!

Desarrolladores han logrado ejecutar un modelo de reconocimiento de voz de Mistral AI, Voxtral Mini 4B Realtime, directamente en el navegador web, eliminando la necesidad de un servidor externo. Esta hazaña, impulsada por Rust y el framework Burn, permite la transcripción de audio en tiempo real uti