cover image
SOCOTEC

[STAGE] Data Scientist H/F

On site

Palaiseau, France

Full Time

01-05-2025

Share this job:
Expired

Job Specifications

Description Du Poste

Au sein du groupe, vous rejoindrez le Data & IA Hub : le centre de compétences en Data & IA pour les 26 pays du groupe SOCOTEC. Le Hub suit une croissance forte des effectifs avec des projets en interne mais aussi auprès des clients du groupe.

Intégré à l’équipe du Data & IA Hub, vous rejoindrez une jeune équipe composée de Data Scientists, Data Engineers et ML Engineers.

Vous travaillerez sur deux missions principales :

En mode projet, vous participerez au pilotage de A à Z de projets finaux : collecte des données, pipeline de prétraitement, modélisation et déploiement. Vous contribuerez au développement des 4 axes principaux du groupe :
Inspection 4.0 : développements d’algorithmes de computer vision et NLP en soutien aux experts métiers sur le terrain
Assistants SOCOTEC : développement d’agents personnalisés pour les services du groupe (RAG, text-to-SQL, …)
IA+X pour des nouveaux services : développement de technique d’hybridation entre physique et IA (jumeau numérique, PINN)
Extraction d’information à partir de documents et de plans
Vous choisirez un sujet de R&D pour vous confronter à l’état de l’art du domaine avec des possibilités de publication scientifique. Les sujets sont présentés et détaillés ci-après:
Inspection 4.0 : Machine learning appliqué à l’inspection des ouvrages d’art
Détection de presque accident sur chantier assitée par IA : EPILOG
Auto-completion de contenu technique pour assister à la rédaction des rapports
Agent de génération de rapport avec canevas intégré dans une plateforme LLM
Agent de Knowledge Management (AXONE IA, RESOTECH IA) employés des techniques de RAG avancés
Smart speech-to-text : transcription et extraction intelligente d'informations avec des LLMs
Le travail sera fait en collaboration avec une équipe de développeurs pour développer les modèles et héberger les livrables sur une plateforme web AWS.

Vous ferez preuve d’autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de son code.

Chez SOCOTEC, les carrières sont construites avec vous vers ce qui vous correspond le mieux : expertise technique, management d’une équipe (lead data), etc.

Vous aurez la possibilité d’interagir à l’international (US, UK, ITA, ESP, NL) et des opportunités de mobilité internationale sont possibles.

Vous ferez preuve d’autonomie, de sagacité et de qualités certaines dans la rédaction et la communication de son code. L’offre peut déboucher sur un CDI à la fin du stage.

Qualifications

Master en Data Science / Machine Learning ou Ingénieur Généraliste avec appétence en data
Bonnes connaissances en statistiques (modélisation, analyse factorielle …)
Maîtrise du langage Python et des bases de données relationnelles (SQL)
Utilisation des outils collaboratifs de développement (GIT, GITLAB, NoteBooks Jupyter, etc …)
Aisance avérée avec les algorithmes de machine learning et de deep learning (un minimum de connaissances théoriques est requis) et maîtrise d’au moins une bibliothèque spécialisée (TensorFlow, Keras, PyTorch …)
Connaissance sur les larges language models (LLM)
Connaissance AWS appréciée (Lambda, Timescale, S3)
Gout affirmé pour les technologies innovantes
Esprit d’équipe
Anglais courant et technique

About the Company

SOCOTEC has built its reputation over 70 years as an independent third party assisting companies in the areas of quality, health and safety, and the environment. Through its inspection and measurement, assistance and consultancy, and training and certification services, SOCOTEC helps to optimize the performance of companies in every sector by managing the risks inherent in their activities. Let's SOCOTEC With consolidated revenue of €1.2bn, operations in 27 countries, 200,000 clients, 12,500 employees and over 250 forms o... Know more