Job Specifications
Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l’optimisation de performance marketing, business et de la transition vers une performance plus durable.
Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d’être acteur.rice de votre avenir professionnel, votre place est sûrement chez Ekimetrics !
Et si nous vous présentions quelques datas ?
400 expert.e.s en data science
1000 projets divers et variés pour plus de 350 clients
5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York
1 milliard de $ de profits générés pour nos clients depuis 2006
Chez Ekimetrics nous avons l’ambition d’accompagner nos clients à repenser leur business model, en réconciliant performance économique et objectifs durables, grâce à la data science.
C’est pourquoi nous avons en interne toutes les compétences nous permettant de répondre aux besoins de nos clients : Product Managers, Product Designers, Data Architects, Lead Tech, Data Engineers, DevOps Engineers, Data Scientists.
L’équipe Data Science que vous pourriez rejoindre
Pourquoi recrutons-nous ?
Au sein d’Ekimetrics, le département Innovation travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. Le département regroupe plusieurs docteurs experts dans le domaine de l’IA générative,du deep learning, de la vision par ordinateur, de la série temporelle, de l’explicabilité, et de la causalité. Deux thèses CIFRE sont en cours, et deux débuteront en 2025. Autour de chaque expert des équipes sont constituées en charge de tester les algorithmes état de l’art et les adapter à des problématiques business spécifiques, de créer de nouvelles méthodologies ou algorithmes répondant à un problème relevé, et d’’assurer la passation en vue d’une intégration dans l’écosystème industriel d’Ekimetrics.
L'équipe de Forecasting au sein du Département d'Innovation d'Ekimetrics est dédiée à l'avancement des capacités prédictives grâce à une recherche de pointe en analyse de séries temporelles, prévision de la demande et prise de décision basée sur les données. Nous exploitons les techniques les plus récentes en intelligence artificielle et en modélisation statistique, incluant l'apprentissage automatique, l'inférence causale et la simulation de scénarios. En collaboration étroite avec des partenaires industriels et académiques, l'équipe s'attaque à des défis complexes de prévision dans divers secteurs, allant du commerce de détail et de la finance à la santé et aux télécommunications. En testant et en perfectionnant continuellement de nouveaux algorithmes et méthodologies, l'équipe de Prévision s'assure qu'Ekimetrics reste à la pointe de la production de prévisions exploitables et d'une grande précision, permettant aux entreprises de prendre des décisions plus éclairées et résilientes dans un marché dynamique.
Objectif du stage : Construire des modèles de fondation pour les données tabulaires
Au cours des dernières années, les modèles de fondation ont révolutionné des domaines comme le traitement du langage naturel (NLP en anglais) et la vision par ordinateur. Cependant, les données tabulaires, essentielles dans de nombreuses industries, n’ont pas encore connu des avancées similaires. Les modèles basés sur des arbres continuent de dominer ce domaine, car des défis liés à l'hétérogénéité des données et à leur intégration entravent l'application de techniques de deep learning aux données tabulaires. Ce stage se concentrera sur le développement de modèles de fondation pour les données tabulaires, en explorant des architectures et méthodes à la pointe de la technologie, telles que TabPFN [1], TabR [2] et CARTE [3], qui relèvent des défis clés grâce à l'apprentissage par transfert (transfer learning en anglais), au deep learning basé sur la récupération et à l'ajustement des données antérieures.
Ce stage offre une opportunité de s'engager dans la recherche avancée en IA, avec la possibilité de poursuivre ensuite un programme de doctorat ou de rejoindre Ekimetrics en tant que Data Scientist en IA.
Plus Particulièrement Vos Responsabilités Seront De
Réaliser une revue de littérature sur les modèles et techniques de pointe dans le deep learning pour les données tabulaires, avec un accent particulier sur les modèles de fondation.
Développer et expérimenter des architectures comme CARTE, qui utilise des représentations en graphes pour contextualiser les entrées des tableaux, TabR, qui intègre des mécanismes de plus proches voisins, et TabPFN, un modèle basé sur des transformateurs pour une classification rapide des données tabulaires.
Collaborer avec votre N+1 pour concevoir, implémenter et évaluer des prototypes de modèles sur des jeux de données réels.
Partager les résultats avec l'équipe interne et contribuer au développement de stratégies à long terme pour le déploiement des modèles de fondation en production.
Le Profil E