GPU
hardware · 25 menciones
Noticias que mencionan GPU
Paisajes virtuales realistas: nueva técnica de erosión
Un desarrollador ha presentado una nueva técnica para generar paisajes virtuales con apariencia de erosión, inspirada en trabajos previos de Clay John y Felix Westin (Fewes) en la plataforma Shadertoy. La técnica, desarrollada durante ocho meses, simula la apariencia de valles y crestas creadas por
IA: la memoria de las conversaciones tiene un costo
La forma en que los modelos de lenguaje grandes (LLM) como ChatGPT gestionan la memoria de las conversaciones, conocida como 'KV cache', tiene un costo físico y económico significativo. Cada interacción, incluso una pregunta sencilla, se traduce en datos almacenados en la memoria de la GPU, con GPT-
25 años rastreando el precio de los huevos
Este artículo relata un proyecto personal de 25 años para rastrear el precio de los huevos a través de recibos escaneados, utilizando tecnologías de vanguardia como agentes de codificación con IA (Codex y Claude) y modelos de visión por computadora. El autor comenzó en 2001 guardando imágenes de rec
Flash-KMeans: K-Means Veloz para Sistemas Online
El algoritmo K-Means es una técnica fundamental en aprendizaje automático para agrupar datos similares. Tradicionalmente, se ha utilizado para tareas como organizar conjuntos de datos o preprocesar incrustaciones (embeddings), pero su aplicación en tiempo real, en sistemas online, ha sido limitada p
Nvidia lanza Gluon: más potencia para GPUs
NVIDIA ha presentado Gluon, una extensión del lenguaje y compilador Triton diseñada para mejorar el rendimiento de las GPU. Gluon ofrece un mayor control a los desarrolladores al exponer más detalles internos del compilador, permitiendo optimizaciones más precisas y un mayor potencial de rendimiento
Horizon: La terminal flexible que reinventa el flujo de trabajo
Un desarrollador ha presentado Horizon, una innovadora terminal para computadoras que redefine la gestión de sesiones de trabajo. Horizon, disponible para Linux, macOS y Windows, ofrece un 'lienzo infinito' donde los usuarios pueden organizar, mover y redimensionar paneles de terminal de manera flex
Algoritmo Slug: Revolución en la renderización de texto
El 'Algoritmo Slug' es una técnica innovadora para renderizar fuentes directamente desde curvas de Bézier en la GPU, desarrollada a partir de 2016 y formalizada en un artículo científico en 2017. Su éxito radica en la capacidad de generar texto de alta calidad, sin depender de mapas de texturas prec
Gráficos 3D: Nuevos Algoritmos Revolucionan la Renderización
Un nuevo avance en gráficos 3D está revolucionando la renderización a través del uso de Campos de Distancia Firmados (SDFs). Los SDFs, una técnica matemática para definir objetos 3D, permiten combinar y manipular formas de manera sencilla, abriendo la puerta a la creación de escenas complejas genera
Flash Attention en TPUs: desafíos y aprendizaje
Este artículo explora los desafíos encontrados al intentar portar el algoritmo Flash Attention, optimizado para GPUs con el lenguaje Triton, a un TPU (Tensor Processing Unit). El objetivo era aprovechar la potencia gratuita de los TPUs ofrecidos en Colab. La experiencia reveló que la transición no f
Microsoft acelera IA: nuevo framework para modelos de lenguaje
Microsoft ha lanzado BitNet, un framework de código abierto diseñado para ejecutar modelos de lenguaje de 1 bit (LLM) de manera eficiente en CPUs y GPUs. Esta tecnología permite ejecutar modelos de lenguaje grandes, como un modelo de 100 mil millones de parámetros, en una sola CPU, alcanzando veloci
IA optimiza GPUs: nuevo agente agiliza el rendimiento
RightNow AI ha presentado AutoKernel, un agente de inteligencia artificial que automatiza la optimización de kernels de GPU, inspirándose en el trabajo de autoresearch de Andrej Karpathy. AutoKernel toma cualquier modelo PyTorch, identifica los kernels de cuello de botella, los optimiza de forma aut
Nvidia invierte en startup de IA: Nscale vale 14.600 millones
La startup británica de centros de datos para inteligencia artificial, Nscale, ha recaudado 2.000 millones de dólares en una ronda de financiación Serie C que la valora en 14.600 millones de dólares, según anunció el lunes. La ronda, liderada por Aker ASA y 8090 Industries, contó con la participació
Thermal Grizzly: Fraude en China retrasa envíos
La empresa de soluciones térmicas Thermal Grizzly ha sufrido pérdidas significativas debido a un fraude en la adquisición de materias primas desde China, según reveló Roman Hartung, conocido como der8auer, en un video reciente. La compañía, buscando alternativas a la escasez y el aumento de precios
Eyot: Nuevo Lenguaje Facilita Programación de GPU
Un nuevo lenguaje de programación llamado Eyot ha sido desarrollado para simplificar el uso de GPUs y aceleradores en tareas computacionales. Creado por Steele Duncan de Cowley fornia Studios, Eyot busca eliminar la complejidad tradicional de la programación GPU, como la gestión de memoria y la comp
Linux: Estudio revela a los 'super-revisores' de código
Un estudio reciente de pebblebed.com analizó 125.000 vulnerabilidades en el kernel de Linux para identificar patrones y áreas de mejora. Los hallazgos revelan que existen “super-revisores”, individuos que corrigen errores casi el doble de rápido que el promedio (47% más rápido), y que los bugs intro
CPU innovadora opera dentro de una GPU
Investigadores han desarrollado una CPU innovadora que opera completamente dentro de una GPU, eliminando la necesidad de interacción con la CPU principal del sistema. Este prototipo, denominado NeuralCPU, ejecuta instrucciones ARM64 reales y utiliza tensores de PyTorch para almacenar registros, memo
Apple M4: Desentrañando el Neural Engine
Este artículo de maderix.substack.com explora el funcionamiento interno del Neural Engine (ANE) de Apple, específicamente el del chip M4 (codename H16G), a través de una ingeniería inversa colaborativa entre un humano y un modelo de IA (Claude Opus 4.6). El objetivo principal es comprender cómo func
SmartKNN: Nuevo algoritmo optimiza el aprendizaje KNN
Un nuevo algoritmo de aprendizaje llamado SmartKNN ha sido desarrollado para mejorar el rendimiento de los métodos de vecinos más cercanos (KNN). El algoritmo, creado por Thatipamula-Jashwanth y disponible en GitHub, busca superar las limitaciones de los enfoques KNN tradicionales, como el tratamien
Renderizado de fuentes: guía con campos de distancia
Este artículo de redblobgames.com explica el renderizado de fuentes utilizando Campos de Distancia Firmados (SDF, por sus siglas en inglés). Los SDFs son una técnica que permite representar formas complejas, como fuentes, como una función que devuelve la distancia más corta a la forma. Esto abre la
C++ acelera reconocimiento de voz con modelo Parakeet
Un equipo de desarrolladores ha creado una implementación en C++ de los modelos de reconocimiento de voz Parakeet de Nvidia, ofreciendo una mejora significativa en la velocidad para su ejecución en dispositivos. El proyecto, alojado en GitHub, utiliza la biblioteca de tensores ligera axiom, que incl
Rust y GPU: Simulaciones Celulares Alcanzan Nueva Velocidad
Un desarrollador ha creado un proyecto en Rust que acelera las simulaciones de autómatas celulares utilizando shaders de GPU. El proyecto, denominado 'Cellarium', permite a los usuarios definir el comportamiento de las células utilizando un subconjunto de Rust, que luego se compila en shaders WGSL p
Chip Taalas acelera Llama 3 con récord de velocidad
Una startup llamada Taalas ha lanzado un chip ASIC que ejecuta el modelo de lenguaje Llama 3.1 8B a una velocidad de inferencia de 17.000 tokens por segundo, lo que equivale a escribir aproximadamente 30 páginas A4 por segundo. La empresa afirma que su chip es 10 veces más barato en costos operativo
Level of Detail: Optimiza el desarrollo de software
Este artículo explora el concepto de 'Level of Detail' (LoD), originalmente utilizado en gráficos 3D para optimizar el rendimiento renderizando modelos con menos detalle a distancia, y lo aplica al desarrollo de software. La idea central es que, al igual que en gráficos, no siempre es necesario tene
Apple desafía a gigantes tecnológicos con estrategia diferente
Apple está desafiando la tendencia de las grandes tecnológicas (Amazon, Microsoft, Alphabet, Meta) al no invertir masivamente en infraestructura de data centers y GPUs, una estrategia que contrasta con la apuesta por el Capex (inversión en capital) de sus competidores. Mientras estas empresas asumen
Rust en GPU: Async/await facilita la programación
VectorWare ha anunciado un hito significativo en la programación de GPU: la capacidad de utilizar las características `async/await` de Rust directamente en la GPU. Esto representa un avance importante hacia la visión de la empresa de facilitar a los desarrolladores la creación de aplicaciones de alt
