cover image
AEROCONTACT

STAGE- Multi-Agent Reinforcement Learning pour l'Autonomie Distribuée d'Essaims de Robots F/H - DIRECTION TECHNIQUE

On site

Massy, France

Internship

03-02-2026

Share this job:

Skills

Communication Python Architecture PyTorch TensorFlow

Job Specifications

Descriptif mission

Safran Electronics & Defense est une entreprise internationale de plus de 19 000 collaboratrices et collaborateurs, qui mobilisent expertises et esprit de corps pour concevoir des solutions de haute technologie dans les domaines de l'aéronautique, de la défense et du spatial. En combinant intelligence humaine et technologique, l'entreprise développe des produits et services pour les acteurs du monde civil et militaires, sur terre, en mer, dans le ciel et dans l'espace. Au sein de Safran Electronics & Defense, l'autonomie multi-robots représente un axe stratégique pour la conception de systèmes collaboratifs capables d'opérer dans des environnements complexes. L'équipe Solutions Algorithmiques Avancées (SAA) explore notamment les architectures permettant à des groupes de robots de coopérer, de se coordonner et de s'adapter dynamiquement aux contraintes opérationnelles. Dans ce contexte, le stage proposé porte sur l'étude et le développement d'approches d'autonomie distribuée pour un essaim de robots engagés dans des tâches d'observation ou d'exploration. L'objectif est d'étudier des mécanismes permettant à un collectif de robots de : Partager des informations localement, Se répartir des zones ou des rôles, S'organiser ou se réorganiser en fonction des conditions de mission (arrivée/depart de membres, niveaux d'énergie, contraintes dynamiques), Et maintenir une coordination efficace sans supervision centralisée. Le stagiaire sera amené à étudier l'état de l'art sur les systèmes multi-agents et les essaims robotiques incluant notamment des approches d'apprentissage multi-agents (MARL), à concevoir une architecture de décision distribuée, puis à expérimenter ces approches au sein d'une plateforme de simulation. Plusieurs paradigmes pourront être explorés selon l'avancement du stage, notamment des approches basées sur l'apprentissage multi-agents, des modèles de communication distribuée ou des mécanismes d'émergence organisationnelle. Le travail contribuera à la compréhension et au développement de futures capacités d'autonomie collective au sein des solutions Safran.

Êtes-vous notre prochain Stagiaire ? « A vous de nous convaincre ! » Parlons de vous: Étudiant(e) en dernière année d'école d'ingénieur ou en Master 2, spécialisé(e) en intelligence artificielle, robotique, informatique ou mathématiques appliquées. Compétences attendues : Connaissances en systèmes multi-agents, robotique collective ou IA distribuée / décentralisée Programmation scientifique (Python, PyTorch/JAX/TensorFlow, bibliothèques ML/RL), Notions en apprentissage par renforcement (RL/MARL) ou en modèles neuronaux modernes (Transformers, GNN), Intérêt marqué pour les architectures collaboratives, les essaims autonomes et les environnements simulés Une bonne compréhension de l'anglais technique est souhaitée.

About the Company

Aerocontact is the french-leading specialized job board in the aviation, aerospace and defence field, founded in 2003, and leader for 13 years now. We totalize more than 200 00 visits and 1 million viewed pages each month. Our international version has been launched in 2014, and currently totalizes 550 job offers and the same database than the French version. 200 000 visits each month – 1 000 000 viewed pages – 225 000 members – 55 000 CVs. Visit the international job board : http://en.aerocontact.com Know more