Skills

Communication Python Scala Tableau SQL NoSQL Big Data GitLab DevOps Docker Kubernetes Machine Learning git Azure AWS Hadoop Spark Databricks

Job Specifications

Probayes a pour vocation de proposer à ses clients les solutions d'Intelligence Artificielle et de Machine Learning les plus performantes possibles. Cela va très souvent de pair avec la manipulation et l'ingestion de très grandes quantités de données (en batch et en temps réel). Il est donc important pour nous de s'appuyer sur les technologies les plus innovantes et notamment dans l'écosystème du Big Data. En tant que Data Architect, vous serez amené à de travailler en étroite collaboration avec les Data Scientists.

Vous aurez les responsabilités suivantes :

Conception de l'architecture des données : Définir et concevoir l'architecture des données de l'entreprise, y compris les modèles de données, les processus ETL (extraction, transformation, chargement) et les solutions de stockage des données en adéquation avec les exigences de nos clients.
Gestion des bases de données : Superviser l'installation, la configuration et la maintenance des bases de données. Assurer leur performance, leur sécurité et leur disponibilité.
Intégration des données : Élaborer des stratégies et des solutions pour l'intégration des données provenant de diverses sources internes et externes.
Gouvernance des données : Mettre en place et maintenir des politiques de gouvernance des données, incluant la qualité des données, la gestion des métadonnées et la conformité réglementaire.

Notre stack s'appuie ainsi sur des technologies Big Data (Hadoop, Spark, …) des SGBD SQL/NoSQL, des messages brokers, des technologies de déploiement (Docker, Kubernetes, ...). Cela permet de proposer notamment pour nos projets internes et nos clients des solutions couvrant différents domaines : machine learning, technologies Big Data, IoT, traitement automatique du langage, optimisation et recherche opérationnelle.

Vous interviendrez en collaboration avec les autres architectes, développeurs et vous contribuerez à l’animation technique de la communauté (veille technologique, partage de connaissances, bonnes pratiques, …).

Profil recherché
Qualifications :

Ingénieur en informatique ou équivalent (Bac+5 minimum)
Expérience de 5 ans minimum

Compétences requises :

Maîtrise de l’environnement Hadoop/Spark
Maitrise de l’environnement Databricks
Maitrise d’au moins un langage de programmation objet (Python, Scala)
Expériences significatives avec des SGBD SQL et NoSQL et connaissances des solutions de stockage et de gestion de données Big Data
Expérience avec des solutions de manipulation des données ETL/ELT
Expérience avec les outils de visualisation de données comme Tableau
Conception et développement des architectures de pipelines de traitement de données
Culture DevOps : Git, Docker, Gitlab-CI

Compétences appréciées :

Mise en place et configuration d’un cluster Hadoop/Spark
Maitrise des solutions de gestion de données dans le cloud (AWS, Azure, …)

Qualités requises :

Vous êtes autonome, bienveillant(e), curieux(se) et rigoureux(se)
Vous avez une solide culture technique
Vous aimez travailler en équipe
Vous avez une bonne communication orale et écrite
Vous avez de bonnes capacités de communication avec les clients

About the Company

Since 2003, Probayes, the AI expert, has been working to improve your performance. Referents on the whole value chain, we collaborate with all sectors. We are multi-specialists, ready to serve you and your strategic challenges. We shape with you your customized solution. Thanks to our mastery of AI : - Machine Learning and Deep Learning : prediction, Interpretability, clustering, recommendation - Operational Research & Combinatorial Optimization : logistics & planning, industrial process, distribution networks, decision Mak... Know more