Pour les employeurs
Thèse Apprentissage par renforcement pour l'optimisation de l'allocation de ressources (F/H)


il y a 7 heures
Date de publication
il y a 7 heures
S/O
Niveau d'expérience
S/O
Temps pleinType de contrat
Temps plein
Lieu : Gennevilliers, France

Construisons ensemble un avenir de confiance

Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus inclusif. Le Groupe investit près de 4 milliards d'euros par an en Recherche & Développement, notamment dans des domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.

Nos engagements, vos avantages
  • Une réussite portée par notre excellence technologique, votre expérience et notre ambition partagée
  • Un package de rémunération attractif
  • Un développement des compétences en continu : parcours de formation, académies et communautés internes
  • Un environnement inclusif, bienveillant et respectant l'équilibre des collaborateurs
  • Un engagement sociétal et environnemental reconnu


Votre quotidienLe Campus de Gennevilliers est le cœur des activités de conception, de développement et de soutien des grands systèmes de défense : radiocommunications, réseaux et systèmes d'infrastructure résilients, communications par satellite, combat collaboratif et cybersécurité. Situé au nord de Paris, il est rapidement accessible en transports en commun.

Le Centre de Compétences Hardware & Logiciel embarqué de Thales SIX GTS France recherche un/une : Doctorant.e CIFRE- Apprentissage par renforcement pour l'optimisation de l'allocation de ressources dans un contexte de communications IoT par satellite

- CDD 3 ans

Basé(e) à Gennevilliers (2/3) et Lyon (1/3)

Thèse co-encadrée par Malcom Egan de l'INRIA à Lyon.

QUI ETES VOUS ?

Vous êtes diplômé d'une grande école ou titulaire Master 2 avec une forte composante mathématique et idéalement un volet d'initiation à la recherche ?

Vous avez abordé dans votre formation les communications numériques ?

Vous maitrisez les techniques d'apprentissage de neurones profonds et l'apprentissage par renforcement ?

Vous avez réalisé des projets ou stages dans un de ses domaines ? Vous avez envie de développer vos compétences au travers d'un doctorat sur un sujet technologique passionnant portant sur des techniques modernes pour les systèmes de communications ?

Vous avez une forte motivation pour la recherche et le développement de solutions deeplearning ?

Vous aimez étudier et résoudre des problèmes nouveaux ?

Vous êtes reconnu(e) pour votre autonomie, votre proactivité votre créativité ?

Vous avez des bases solides en deeplearning et des compétences en Python et PyTorch ?

Alors ce doctorat est fait pour vous !

CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE

Une des missions du centre de compétence Hardware Technologies, Tools & Engineering, est la définition de protocoles radio et des traitements numériques du signal qui seront utilisés dans les équipements, leur implémentation et leurs évolutions.

Dans le contexte des réseaux de communications pour l'internet des objets (IoT) par satellite, on recherche des méthodes d'accès multiples performantes et leur paramétrage dynamique permettant d'optimiser les capacités du système pour la liaison montante vers un ou plusieurs satellites à orbite basse (low earth orbit - LEO).

L'objectif de la thèse est de développer des solutions à base de réseaux de neurones profonds utilisant en particulier l'apprentissage par renforcement (RL). On recherchera des solutions algorithmiques et les architectures associées prenant en compte les contraintes du système, à savoir : un feedback limité, les capacités de décodage de la couche PHY pour gérer les collisions selon le récepteur mutli-utilisateur considéré. On s'intéressera à des solutions de type single-agent RL (SARL) quand l'allocation est centralisée ou multi-agent RL (MARL) quand la décision est distribuée et laissée aux nœuds.

Votre mission sera dans un premier temps d'étudier l'état de l'art des composantes du sujet (contexte IoT satellite, protocoles, récepteurs multi-utilisateurs, techniques/architectures de Deep-RL (DRL)...), puis de proposer des solutions DRL, de les mettre en œuvre et enfin de les évaluer. Vous commencerez par réaliser l'apprentissage des réseaux de neurones des architectures proposées en s'assurant de la convergence de l'apprentissage (choix des hyperparamètres...). Puis ferez une évaluation comparée de ces architectures (inférence) selon différents scénarios afin de quantifier leur gains et capacités de généralisation

Thales, entreprise Handi-Engagée, reconnait tous les talents. La diversité est notre meilleur atout. Postulez et rejoignez nous !
Balises associées
-
RÉSUMÉ DE L' OFFRE
Thèse Apprentissage par renforcement pour l'optimisation de l'allocation de ressources (F/H)
Gennevilliers
il y a 7 heures
S/O
Temps plein

Thèse Apprentissage par renforcement pour l'optimisation de l'allocation de ressources (F/H)