Aplicación de aprendizaje por refuerzo para el estacionamiento automático de un automóvil en un ambiente simulado
Resumen
En el presente trabajo se propone una solución de aprendizaje por refuerzo para efectuar el estacionamiento perpendicular automático en un vehículo de cuatro ruedas. Se centra en diseñar una función de recompensas que es usada para entrenar a los algoritmos Proximal Policy Optimization y Soft Actor Critic, además de la combinación de ambos en un ensamble. Finalmente, se logra obtener un éxito cercano al 99 % y una desviación final de aproximadamente un grado. Al entrenar los algoritmos con posiciones iniciales aleatorias se obtiene un
desempeño pobre.