Aprendizaje por refuerzo en vivo para robots móviles | Publicación