Investigadores de motores de ajedrez están revolucionando la eficiencia de la inteligencia artificial a través de nuevas técnicas de entrenamiento, según un informe reciente. Inicialmente, los motores de ajedrez, como lc0, utilizaban el aprendizaje por refuerzo (RL) para entrenar sus modelos, donde el motor jugaba contra sí mismo y el modelo aprendía a predecir el resultado. Sin embargo, se ha descubierto que este proceso no es estrictamente necesario. Una técnica clave es la destilación, donde un modelo 'bueno' aprende de un modelo 'malo' combinado con la búsqueda, lo que elimina la necesidad de generar juegos para el entrenamiento. Además, se está aplicando la destilación en tiempo real, ajustando dinámicamente el modelo basándose en la evaluación de posiciones tempranas. Un método aún más novedoso, llamado SPSA, perturba aleatoriamente los pesos del modelo y ajusta en la dirección que conduce a más victorias, aunque es computacionalmente costoso. Finalmente, se están afinando incluso los parámetros más básicos del algoritmo de búsqueda utilizando SPSA, logrando mejoras significativas en el rendimiento. Estas innovaciones, combinadas con arquitecturas de transformadores, están impulsando avances significativos en la eficiencia y el rendimiento de los motores de ajedrez, con implicaciones potenciales para el desarrollo de la IA en otros campos.
