Aprendizaje por refuerzo con búsqueda de políticas: simulación y aplicación a un sistema electromecánico | Publicación