Ajedrez: Función Hard-Swish frena a motor NNUE

Un investigador ha experimentado con nuevas funciones de activación, específicamente Swish y SwiGLU, en el modelo NNUE de Viridithas, un motor de ajedrez. Inicialmente, la sustitución de las funciones SCReLU en las capas L₁ y L₂ con Hard-Swish provocó una disminución significativa en la eficiencia d

LiDAR: Datos de onda revelan detalles cruciales

El LiDAR (Light Detection and Ranging) se ha convertido en una tecnología esencial para la conducción autónoma, proporcionando escaneos 3D de alta resolución que permiten una comprensión precisa del entorno. Tradicionalmente, los sensores LiDAR miden la intensidad de la luz láser reflejada en funció

Redes neuronales: error hacia adelante, un nuevo enfoque

Este artículo de investigación explora una pregunta fundamental en el entrenamiento de redes neuronales recurrentes (RNN): ¿por qué la retropropagación a través del tiempo (BPTT) siempre se ejecuta hacia atrás? Los autores proponen y derivan un algoritmo que propaga el error hacia adelante en el tie

IA: ¿Homogeneiza la creatividad?

El artículo "AI makes you boring" plantea una crítica inusual sobre el impacto de la inteligencia artificial (IA) en la creatividad y la calidad de las discusiones técnicas, más allá de la simple eficiencia en el desarrollo de software. No se trata de un rechazo a la IA como herramienta, sino de una

Alibaba crea RynnBrain: IA que 've' y comprende el mundo

RynnBrain es un modelo de base encarnado (embodied foundation model) desarrollado por Alibaba Damo Academy, diseñado para comprender e interactuar con el mundo físico de una manera más profunda que los modelos de lenguaje tradicionales. Imagina un modelo que no solo entiende el lenguaje, sino que ta

DjVu: el formato de archivo que aprende

DjVu es un formato de archivo diseñado para comprimir documentos escaneados, especialmente libros y documentos técnicos, de manera mucho más eficiente que el formato PDF. Aunque menos conocido hoy en día, su superioridad radica en su capacidad para manejar imágenes y texto de forma inteligente, a di

GLM-OCR: Nuevo OCR de Código Abierto Lidera en Precisión

Investigadores han desarrollado GLM-OCR, un nuevo modelo de código abierto para el reconocimiento óptico de caracteres (OCR) que alcanza un rendimiento de vanguardia en la comprensión de documentos complejos. Basado en la arquitectura GLM-V encoder-decoder, GLM-OCR incorpora técnicas innovadoras com