abstract = "As main contribution we propose a fast and automated
gradient-enriched machine learning control (gMLC)
algorithm to learn feedback control laws. The framework
alternates between explorative and exploitive
gradient-based iterations, generalizing genetic
programming control (GPC) and the Explorative Gradient
Method (EGM). The gMLC algorithm has been demonstrated
both numerically, with the stabilization of a MIMO
system, the fluidic pinball and experimentally, with
the control of the open cavity. In both cases, gMLC
successfully built closed-loop control laws allowing
the best performances so far. We prove, in particular,
that the mechanisms behind the control of the cavity
rely effectively on feedback. The benchmark of gMLC
with GPC on both problems, shows that gMLC outperforms
GPC both in terms of convergence speed and final
solution efficiency. An acceleration of at least a
factor 10 between the GPC and gMLC has been achieved,
allowing the control of many experiments, e.g., with a
large number of inputs and outputs or multiple
parameters testing for robustness. The two developed
codes are both freely available online: xMLC, based on
GPC and gMLC, based on our new algorithm.",
resume = "Nous proposons un algorithme rapide et automatise de
controle par apprentissage automatique enrichi de
methodes de gradients (gMLC) pour l{'}optimisation de
lois de controle en boucle fermee. Notre methodologie
alterne entre l{'}exploration de l{'}espace de
recherche et l{'}exploitation des gradients locaux, et
generalise la programmation genetique (GPC) et
l{'}Explorative Gradient Method (EGM). L{'}algorithme
gMLC est implemente et teste numeriquement, par la
stabilisation d{'}un systeme multi-entrees
multi-sorties, le pinball fluidique et
experimentalement, par le controle de la cavite
ouverte. Dans les deux cas, gMLC a construit des lois
de controle en boucle fermee permettant les meilleures
performances repertoriees. Nous demontrons aussi que
les mecanismes de controle pour la cavite reposent
effectivement sur la retroaction a partir de la mesure
de l{'}etat. La comparaison entre gMLC et GPC est
toujours a l{'}avantage de gMLC aussi bien en termes de
vitesse de convergence que de qualite de la solution
finale. Le gain en vitesse d{'}apprentissage est d{'}au
moins un facteur 10, permettant d{'}envisager le
controle d{'}experiences complexes avec, par exemple,
un grand nombre d{'}entrees et de sorties ou des tests
multi-parametres pour assurer la robustesse de
l{'}apprentissage. Enfin, deux codes sont mis en ligne
en libre acces: xMLC, base sur le controle par
programmation genetique et gMLC, base sur notre nouvel
algorithme.",