THESE CIFRE – MODELISATION 3D GRANDE ECHELLE DE BÂTIMENT EN LOD2 PAR APPRENTISSAGE PROFOND

SIRADEL – Filiale du groupe ENGIE, construit des solutions numériques pour accélérer la transition vers un monde mieux connecté, décarboné et résilient, qui impacte positivement la planète et la société.

Experte en production de données géoréférencées, modélisation 3D, construction de jumeaux numériques, simulation et intelligence artificielle depuis 1994, SIRADEL accompagne les acteurs des télécoms, de l’industrie et des villes et collectivités dans leurs enjeux de durabilité et de transformation numérique.

En rejoignant Siradel, vous serez plongé(e) au cœur d’une entreprise à taille humaine (180 personnes à Rennes, Paris, Nice, Lyon, Toronto, Shanghai) afin de participer à des projets stimulants, au cœur des enjeux déterminants de transition énergétique et sobriété numérique, dans un contexte  multiculturel.

SIRADEL et sa Raison d’Être

La R&D du département Digital & Territory recherche son/sa doctorant(e) en Modélisation 3D grande-échelle de bâtiments en LOD2 par apprentissage profond pour rejoindre notre équipe dynamique et motivante.

CONTEXTE

Le jumeau numérique 3D d’un territoire permet de visualiser son état présent et de simuler son état futur. Il joue un rôle important dans la planification urbaine et, de ce fait, sa constitution rencontre une forte demande à travers le monde. De nombreux usages nécessitent une modélisation 3D précise des bâtiments. Or c’est une tâche complexe du fait de la diversité des architectures et des aménagements urbains, et la difficulté varie aussi en fonction du niveau de détail de la modélisation. Le niveau de détail LOD2 (au sens CityGML) est fréquemment demandé ; il consiste à représenter les murs, les pans de toit et les superstructures significatives, sous forme de polygones jointifs. Chaque polygone représente un éléments architectural complet (contrairement aux maillages de triangles) auquel il est possible d’associer des attributs (descriptions, mesure, résultat de simulation).

Pour une modélisation à grande échelle réaliste et précise des bâtiments, des données acquises par avion ou par satellite sont utilisées. On parle alors de reconstruction 3D à partir de données externes. Les données acquises sont soit des nuages de points LIDAR, soit des cartes d’élévation appelées Modèles Numériques de Surface (MNS). La précision et la disponibilité de ces données rend désormais possible l’automatisation de cette tâche par des algorithmes de reconstruction 3D.

Les algorithmes traditionnels basés sur des critères géométriques spécifiques sont actuellement les plus utilisés. Ils extraient des primitives géométriques puis déduisent la structure du bâtiment, mais ne parviennent pas suffisamment à s’adapter à la richesse des formes architecturales ainsi qu’aux imperfections des données. Dans le même temps, les algorithmes par apprentissage profond ont prouvé leur flexibilité et leur précision dans des tâches complexes 2D ou 3D comme la segmentation sémantique ou la génération de données. Ces algorithmes prennent peu à peu de l’importance dans le domaine de la reconstruction 3D de bâtiments, notamment grâce à la création récente de bases de données d’apprentissage suffisamment grandes.

Néanmoins, aucune solution proposée n’a encore été largement adoptée. Ils forment cependant une base de référence solide pour l’étude d’une nouvelle méthode de reconstruction 3D de bâtiments.

ETAT DE L’ART

Les approches par apprentissage profond suivent généralement le même raisonnement que les techniques géométriques traditionnels, en deux étapes : extraction de primitives puis reconstruction topologique. Pour l’extraction de primitives, les architectures utilisées sont de type Point-Net++ (1) ou convolutive (2). Pour la reconstruction topologique, il y a des méthodes génératives ou graphiques. Plus récemment, des approches génératives pour réaliser ces 2 étapes avec des Transformers autorégressif ont été proposées. Lorsque ces étapes sont connectées et entraînées bout à bout (approche End-2-End), alors de meilleurs résultats sont obtenus en évitant des étapes intermédiaires qui sont sources d’accumulation d’erreurs. Toutefois, la majorité de ces méthodes sont évaluées sur des données restreintes, synthétiques, ou même sur des données 3D quelconques non spécifiques aux bâtiments.

OBJECTIF

Le but de cette thèse est d’automatiser la modélisation LOD2 à partir de données aéroportées recouvrant de grandes zones géographiques (métropole, département). Ces données sources pourront être des nuages de points LiDAR ou des Modèles Numériques de Surface issus de corrélation stéréo, qui auront été classifiés automatiquement.

L’algorithme développé sera basé sur du Deep Learning. Les méthodes End-to-End semblent prometteuses car elles évitent la propagation d’erreurs entre les différentes étapes. Cependant la solution choisie devra être pragmatique et prendre en compte la réalité d’une production industrielle (bruit, incomplétude, erreur de classification). La topologie des modèles 3D sera également au cœur des préoccupations (modèles étanches, arêtes non-manifold, planéité). Le réseau de neurones devra donc être capable de qualifier la donnée en entrée, pour évaluer dans quelle mesure il peut lui faire confiance, et évaluer également le modèle 3D produit en indiquant un score de fiabilité interprétable par un non expert. L’algorithme développé devra être confronté à une grande variété de configurations urbaines et architecturales, en se basant sur des jeux de données publics et internes à Siradel.

Par ailleurs, dans les zones urbaines, la densité du bâti forme de grands blocs de bâtiment mitoyens. L’individualisation de ces bâtiments est généralement peu abordée dans les études, qui considèrent les contours 2D toujours disponibles. D’un point de vue industriel c’est pourtant une étape non négligeable. Une segmentation automatique des instances de bâtiment (croissance de région, super-points…), intégrée à la chaine de traitement, serait donc une contribution supplémentaire majeure.

PROFIL

Étudiant M2 en vision par ordinateur, photogrammétrie, télédétection, deep learning.

Une connaissance en géométrie 3D serait appréciée.

Maitrise de Python et idéalement de C++

Anglais courant

DIRECTION DE THESE

Directeur de thèse : Bruno Vallet (LASTIG, IGN)

Co-encadrement :

Jérôme Dolbecq (Département Territoires Numériques, SIRADEL – ENGIE)

Guillaume Despine (Département Territoires Numériques, SIRADEL – ENGIE)

Wu Teng (LASTIG, IGN)

PLANNING PREVISOONNEL CDD 3 ANS

[T0 à T0+3 mois] Veille / Etude bibliographique

[T0+3 à T0+12] Etude et évaluation de quelques méthodes

[T0+12 à T0+24] Développement nouvelle méthode

[T0+24 à T0+30] Intégration dans une chaine complète et mise en place du mécanisme de fine tuning

[T0+30 à T0+36] Rédaction

LOCALISATION :

Année 1 : Equipe ACTE – Laboratoire LASTIG – Champs sur Marne (77)

Années 2 et 3 : Equipe RD DT – Siradel – ENGIE – Rennes (35)

Des déplacements ponctuels entre les deux sites seront à prévoir

LA SUITE DES EVENEMENTS :

Envoyez un mail à bruno.vallet@ign.fr et sbenitez@siradel.com avec :

Votre curriculum vitae

Une lettre de motivation

Un relevé de vos notes de master

Une ou plusieurs lettres de recommandation (le cas échéant)

Catégorie: CDD
Job Type: Full Time
Localisation: Saint-Grégoire

Apply for this position

Allowed Type(s): .pdf, .doc, .docx