20 May 2026 · Original en inglés · Resumen IA

Nueva herramienta permite ver la velocidad real de modelos de lenguaje locales

Fuentes: ▍tokenspeed

Una nueva herramienta visualiza en tiempo real la velocidad de generación de tokens de modelos de lenguaje locales, permitiendo a usuarios experimentar con distintas tasas de generación que van desde 5 hasta 800 tokens por segundo. La aplicación muestra cuatro modos de visualización: código con resaltado de sintaxis, texto Prosa, pensamiento (imitando modelos de razonamiento) y agente (alternando llamadas a herramientas). Los usuarios pueden comparar velocidades típicas: 5 tok/s equivalente a modelos Raspberry-Pi, 60 tok/s para Claude o GPT hosted, 200 tok/s en territorio Groq y 800 tok/s en Cerebras. El objetivo es cerrar la brecha entre los números abstractos de los benchmark y la experiencia perceptual real, ya que el código es más token-denso que la prosa, haciendo que la misma velocidad se perciba de manera muy diferente según el contenido.

Temas

ia desarrollo seguridad

Etiquetas

modelos de lenguaje herramienta visualizadora inteligencia artificial benchmark tokens por segundo hardware gpu open source

Entidades mencionadas

GPT software

M3 hardware

tiktoken software

Cerebras organization

El cerebro es un órgano que centraliza la actividad del sistema nervioso y existe en la mayor parte de los animales.

Ver en Wikipedia

Raspberry-Pi hardware

BPE protocol_standard

processUserInput software

Groq location

Groenlandia es una isla en la zona nororiental de América del Norte, entre los océanos Atlántico y Glacial Ártico, que políticamente es una nación constituyente del Reino de Dinamarca. Con un total de

Ver en Wikipedia

Claude person

Claude Monet fue un pintor francés, uno de los creadores del impresionismo. El término impresionismo deriva del título de su obra Impresión, sol naciente (1872).