← Retour aux offres

Adaptation de domaine pour la détection et la segmentation : du capteur pinhole au capteur fisheye (H/F)

Postée le 15 oct.

Lieu : Palaiseau, France · Contrat : Stage · Rémunération : A négocier

Société : CEA List

Basé à Paris-Saclay, le CEA List est l’un des quatre instituts de recherche technologique de CEA
Tech, direction de la recherche technologique du CEA. Dédié aux systèmes numériques intelligents, il
contribue au développement de la compétitivité des entreprises par le développement et le transfert de
technologies.
L’expertise et les compétences développées par les 800 ingénieurs-chercheurs et techniciens du
CEA List permettent à l’Institut d’accompagner chaque année plus de 200 entreprises françaises et
étrangères sur des projets de recherche appliquée s’appuyant sur 4 programmes et 9 plateformes
technologiques. 21 start-ups ont été créées depuis 2003.
Labellisé Institut Carnot depuis 2006, le CEA List est aujourd’hui l’institut Carnot Technologies
Numériques.
Le Laboratoire de Vision et Apprentissage pour l’analyse de scène (LVA) mène ses recherches dans
le domaine de la Vision par Ordinateur (Computer Vision) selon quatre axes principaux :
- La reconnaissance visuelle (détection et/ou segmentation d’objets, de personnes, de patterns;
détection d’anomalies; caractérisation)
- L’analyse du comportement (reconnaissance de gestes, d’actions, d’activités, de
comportements anormaux ou spécifiques pour des individus, un groupe, une foule)
- L’annotation intelligente (annotation à grande échelle de données visuelles 2D/3D de manière
semi-automatique)
- La perception et la décision (processus de décision markovien, navigation).

Description du poste

La détection et la segmentation sont des tâches de vision par ordinateur de mieux en mieux
maîtrisées sur des images issues de capteur pinhole, c’est-à-dire des images classiques, sans beaucoup
de distorsions sur les bords. En effet, pour apprendre des modèles de détection ou de segmentation, il
est nécessaire d’utiliser les grandes bases de données publiques d’images annotées, ces datasets sont
constitués d’images de la vie courante, issues de capteur pinhole.
Cependant, les caméras fisheye sont de plus en plus utilisées, que ce soit pour la vidéo surveillance,
le véhicule autonome ou l’industrie. En effet, ce type de caméra possède l’avantage de couvrir un large
champ de la scène à elle toute seule. L’inconvénient est que les images issues de capteurs fisheye
présentent d’importantes distorsions.
Les modèles de détections et de segmentations d’objets appris sur des images pinhole ne sont plus
aussi performants sur ce type d’images à moins qu’elles soient préalablement redressées. Or le
mécanisme de redressement des images est coûteux en temps de calcul et ne peut s’appliquer sur toute
l’image sans perdre une partie du champ de vision.

L’état de l’art sur l’adaptation de domaine des modèles convolutifs est de plus en plus riche.
Cependant il concerne essentiellement l’adaptation entre deux datasets dont les contextes sont
différents mais dont les images sont issues de capteurs pinhole pour les deux. Par exemple, [1] présente
une étude sur l’adaptation de domaine pour la détection d’objet, [2] et [3] proposent des méthodes
concernant la segmentation d’instances.

L’objectif du stage est donc de mettre en place une méthode d’adaptation de domaine qui permet
d’appliquer les modèles appris sur des images pinhole sur des images fisheye. La première mission du
stagiaire sera de prendre connaissance de l’état de l’art en adaptation de domaine de manière à
proposer une première méthode pour la détection d’objet dans les images fisheye. Dans un second
temps, la méthode pourra être étendue à la segmentation. Les résultats obtenus pourront faire l’objet
de publications scientifiques. Ce stage ouvre la possibilité de poursuite en thèse sur cette
problématique.

[1] Li, W., Li, F., Luo, Y., & Wang, P. (2020). Deep Domain Adaptive Object Detection: a Survey. arXiv
preprint arXiv:2002.06797.
[2] J. Hoffman, D. Wang, F. Yu, and T. Darrell.Fcns in the wild: Pixel-level adversarial and constraintbased adaptation. arXiv preprintarXiv:1612.02649, 2016
[3] M. Biasetton, U. Michieli, G. Agresti, and P. Zanuttigh. Unsupervised domain adaptation
for semantic segmentation of urban scenes. In CVPRW , 2019.

Profil recherché

Niveau demandé : Ingénieur, Master 2
Ce stage ouvre la possibilité de poursuite en thèse et ingénieur R&D dans notre laboratoire.
Durée : 6 mois
Rémunération : entre 700 € et 1300 € suivant la formation.
Compétences requises :
- Vision par ordinateur
- Apprentissage automatique (deep learning)
- Reconnaissance de formes
- C/C++, Python
- La maîtrise d’un framework d’apprentissage profond (en particulier Tensorflow ou PyTorch) est
un plus.

Voir le fichier joint

Pour postuler :

Astrid ORCESI
Tél +33 (0)1 69 08 33 63
E-mail astrid.orcesi@cea.fr