← Retour aux offres

Apprentissage par renforcement multi-objectifs pour la conduite autonome en environnement urbain (H/F)

Postée le 10 oct.

Lieu : Palaiseau, France · Contrat : Stage · Rémunération : A négocier

Société : CEA List

Basé à Paris-Saclay, le CEA List est l’un des quatre instituts de recherche technologique de CEA Tech, direction de la recherche technologique du CEA. Dédié aux systèmes numériques intelligents, il contribue au développement de la compétitivité des entreprises par le développement et le transfert de technologies.

L’expertise et les compétences développées par les 800 ingénieurs-chercheurs et techniciens du CEA List permettent à l’Institut d’accompagner chaque année plus de 200 entreprises françaises et étrangères sur des projets de recherche appliquée s’appuyant sur 4 programmes et 9 plateformes technologiques. 21 start-ups ont été créées depuis 2003. Labellisé Institut Carnot depuis 2006, le CEA List est aujourd’hui l’institut Carnot Technologies Numériques.

Le Laboratoire de Vision et Apprentissage pour l’analyse de scène (LVA) mène ses recherches dans le domaine de la Vision par Ordinateur et de l’Intelligence Artificielle selon quatre axes principaux:
- La reconnaissance visuelle (détection, reconnaissance fine et segmentation d’objets, segmentation de scène, détection d’anomalies)
- L’analyse du comportement (reconnaissance de gestes, d’actions, d’activités, détection de comportements anormaux ou spécifiques)
- L’annotation intelligente à grande échelle de données visuelles
- Les modèles de perception et décision.

Description du poste

Les véhicules autonomes se développent rapidement, néanmoins la conduite en zone urbaine est encore un problème complexe et mal maîtrisé. En effet la conduite en ville doit prendre en compte de nombreux acteurs dont le comportement est difficilement modélisable. Dans ce cadre, un pilote autonome peut être conçu à l’aide d’algorithmes d’apprentissage automatique (machine learning). En particulier, nous nous concentrons sur une approche d’apprentissage par renforcement consistant à exploiter des récompenses afin d’améliorer son comportement.

Dans le cas de la conduite autonome urbaine, de nombreuses situations sont particulièrement complexes à gérer, telles que le respect de la signalétique (vitesse maximale, feux rouges, stop...) ou la gestion des autres usagers (éviter les piétons, doubler un autre véhicule...). Dans ce cas, l'agent autonome devra être capable d'exécuter plusieurs tâches à la fois pour évoluer en toute sécurité dans l'environnement.

L’objectif de ce stage est de proposer des solutions algorithmiques reposant sur le paradigme de l'apprentissage par renforcement pour gérer ces situations efficacement. Plusieurs pistes seront envisagées: ajout d'objectif multi-tâches, prise en compte des règles du code de la route, utilisation des connaissances a priori sur objets présents sur la route, ...

Les expérimentations et les évaluations seront effectuées en suivant le protocole proposé dans le CARLA Autonomous Driving Challenge [1] [2]. Le stagiaire travaillera en étroite collaboration avec les chercheurs de notre laboratoire. Les algorithmes d’apprentissage sont implémentés en python / tensorflow.

Mots-clés:

vision par ordinateur, apprentissage profond, apprentissage par renforcement, conduite autonome, multi-objectifs.

Références:

[1] Dosovitskiy, Alexey, et al. "CARLA: An open urban driving simulator." arXiv preprint arXiv:1711.03938 (2017).
[2] CARLA Challenge, https://carlachallenge.org/

Profil recherché

Niveau demandé: Ingénieur, Master 2
Ce stage ouvre la possibilité de poursuite en thèse et ingénieur R&D dans notre laboratoire.
Durée: 6 mois
Rémunération: entre 700 € et 1300 € suivant la formation.
Compétences requises:
- Vision par ordinateur
- Apprentissage automatique (deep learning)
- Reconnaissance de formes
- C/C++, Python
- La maîtrise d’un framework d’apprentissage profond (en particulier Tensorflow ou PyTorch) est un plus.

Voir le fichier joint

Pour postuler :

Florence Carton
florence.carton@cea.fr