aprendizaje profundo
7 noticias
Ajedrez: Función Hard-Swish frena a motor NNUE
Un investigador ha experimentado con nuevas funciones de activación, específicamente Swish y SwiGLU, en el modelo NNUE de Viridithas, un motor de ajedrez. Inicialmente, la sustitución de las funciones SCReLU en las capas L₁ y L₂ con Hard-Swish provocó una disminución significativa en la eficiencia d
LiDAR: Datos de onda revelan detalles cruciales
El LiDAR (Light Detection and Ranging) se ha convertido en una tecnología esencial para la conducción autónoma, proporcionando escaneos 3D de alta resolución que permiten una comprensión precisa del entorno. Tradicionalmente, los sensores LiDAR miden la intensidad de la luz láser reflejada en funció
Redes neuronales: error hacia adelante, un nuevo enfoque
Este artículo de investigación explora una pregunta fundamental en el entrenamiento de redes neuronales recurrentes (RNN): ¿por qué la retropropagación a través del tiempo (BPTT) siempre se ejecuta hacia atrás? Los autores proponen y derivan un algoritmo que propaga el error hacia adelante en el tie
IA: ¿Homogeneiza la creatividad?
El artículo "AI makes you boring" plantea una crítica inusual sobre el impacto de la inteligencia artificial (IA) en la creatividad y la calidad de las discusiones técnicas, más allá de la simple eficiencia en el desarrollo de software. No se trata de un rechazo a la IA como herramienta, sino de una
Alibaba crea RynnBrain: IA que 've' y comprende el mundo
RynnBrain es un modelo de base encarnado (embodied foundation model) desarrollado por Alibaba Damo Academy, diseñado para comprender e interactuar con el mundo físico de una manera más profunda que los modelos de lenguaje tradicionales. Imagina un modelo que no solo entiende el lenguaje, sino que ta
DjVu: el formato de archivo que aprende
DjVu es un formato de archivo diseñado para comprimir documentos escaneados, especialmente libros y documentos técnicos, de manera mucho más eficiente que el formato PDF. Aunque menos conocido hoy en día, su superioridad radica en su capacidad para manejar imágenes y texto de forma inteligente, a di
GLM-OCR: Nuevo OCR de Código Abierto Lidera en Precisión
Investigadores han desarrollado GLM-OCR, un nuevo modelo de código abierto para el reconocimiento óptico de caracteres (OCR) que alcanza un rendimiento de vanguardia en la comprensión de documentos complejos. Basado en la arquitectura GLM-V encoder-decoder, GLM-OCR incorpora técnicas innovadoras com
