aprendizaje por refuerzo

08 Jun 2026

El robot humanoide Pemba corona el Chimborazo y prepara su asalto al Everest

Una versión modificada del robot humanoide Unitree G1, bautizada como Pemba, alcanzó la cima del Chimborazo (Ecuador), situada a 6.200 metros de altitud, tras 16 horas de ascenso. La expedición, liderada por Pablo y organizada por Unitree Robotics, tenía como objetivo probar la autonomía y resistenc

18 May 2026

Odyssey presenta Agora-1: mundos compartidos entre humanos e inteligencia artificial

Odyssey ha lanzado hoy Agora-1, el primer modelo de mundo multiagente que permite a múltiples participantes, tanto humanos como inteligencia artificial, compartir e interactuar dentro de la misma simulación de mundo en tiempo real. El sistema, presentado el 18 de mayo de 2026, utiliza el videojuego

06 May 2026

Aprendizaje por Refuerzo: Mejorando con Retroalimentación Detallada

El aprendizaje por refuerzo (RL) tradicional se enfrenta a una limitación significativa: descarta la mayor parte de la información valiosa que los evaluadores proporcionan. En lugar de aprovechar la retroalimentación detallada, el RL la comprime en una única puntuación (recompensa), lo que obliga al

05 May 2026

glm-5v-turbo: nuevo modelo para agentes inteligentes

El documento presenta GLM-5V-Turbo, un modelo de lenguaje multimodal de última generación diseñado específicamente para potenciar agentes inteligentes capaces de interactuar con el mundo real. La tendencia actual en inteligencia artificial apunta a crear modelos de lenguaje que no solo procesen text

10 Apr 2026

Simulación de cuadricóptero: guía paso a paso

Este artículo del blog de mrandri19.github.io explica cómo simular un cuadricóptero en 2D desde cero. La simulación es un paso fundamental para diseñar controladores o entrenar agentes de aprendizaje por refuerzo, ya que proporciona un entorno virtual para probar y refinar algoritmos antes de implem

18 Mar 2026

ia: ¿por qué no aprende como nosotros?

El artículo "Why AI systems don't learn and what to do about it: Lessons on autonomous learning from cognitive science" plantea una crítica fundamental a la forma en que actualmente se construyen los sistemas de Inteligencia Artificial, argumentando que carecen de la capacidad de aprendizaje autónom

15 Mar 2026

Robots aprenden tenis con datos limitados: un avance

LATENT es un sistema innovador que permite a robots humanoides aprender a jugar tenis, incluso con datos de entrenamiento incompletos y fragmentados. El problema que aborda es la dificultad de replicar las complejas habilidades de un jugador de tenis humano en un robot. Tradicionalmente, entrenar a

04 Mar 2026

IA al estilo cerebro: ¿fin de las matrices?

Investigadores están reevaluando la dependencia de las redes neuronales artificiales en las matemáticas matriciales, inspirándose en cómo funciona el cerebro humano. El artículo explora cómo el cerebro procesa la información a través de una combinación de percepción de arriba hacia abajo (predicción

20 Feb 2026

Carga de VE: Investigadores Exponen Vulnerabilidad con Ataques

La creciente adopción de vehículos eléctricos (VE) está generando una demanda significativa de estaciones de carga de VE (EVCS), lo que a su vez plantea desafíos para la estabilidad y fiabilidad de la red eléctrica. Para abordar esto, investigadores han desarrollado PHANTOM, un sistema innovador que

17 Feb 2026

Ajedrez impulsa avances en inteligencia artificial

Investigadores de motores de ajedrez están revolucionando la eficiencia de la inteligencia artificial a través de nuevas técnicas de entrenamiento, según un informe reciente. Inicialmente, los motores de ajedrez, como lc0, utilizaban el aprendizaje por refuerzo (RL) para entrenar sus modelos, donde

13 Feb 2026

IA: CEO ve 'país de genios' en centros de datos

Dario Amodei, CEO de Anthropic, predice que estamos a pocos años de una era donde los centros de datos albergarán una concentración sin precedentes de inteligencia, describiéndola como “un país de genios”. En una reciente entrevista, Amodei reiteró su hipótesis de la “Gran Masa de Computación”, argu