Nous recherchons un(e) Data Scientist expérimenté(e) pour rejoindre notre équipe tournée vers l’avenir. Dans ce rôle, vous exploiterez des techniques de pointe en apprentissage automatique, modélisation statistique et apprentissage profond pour relever des défis commerciaux complexes. Vous jouerez un rôle clé dans la conception et l’architecture de nos solutions, en garantissant des résultats de haute qualité et en maintenant une base de code robuste. Développer, tester et déployer des modèles d’apprentissage automatique de bout en bout, avec un accent particulier sur l’apprentissage multimodal et les modèles Vision-Langage (VLMs) Stimuler l’innovation en explorant de nouvelles architectures de modèles, en appliquant l’apprentissage par transfert et en optimisant les performances Collaborer avec les ingénieurs pour mettre en œuvre de bonnes pratiques MLOps, incluant le versionnage des modèles, le suivi des expériences et le déploiement automatisé Mettre en place et maintenir des systèmes d’observabilité pour les LLMs, surveiller les performances, détecter les biais et analyser les dérives Réaliser des tests A/B et des évaluations statistiques pour valider les améliorations des modèles Construire et optimiser les pipelines de données et les workflows d’ingénierie des caractéristiques en partenariat avec les ingénieurs ML Participer à des conférences internationales et y représenter l’entreprise, en partageant des idées et des retours d’expérience Contribuer à la documentation interne et externe, y compris des articles, présentations et billets de blog Votre Profil Plus de 6 ans d’expérience en science des données, avec une forte spécialisation en apprentissage profond et traitement du langage naturel ; une expérience en vision par ordinateur est un plus Maîtrise avancée de Python, avec une expérience pratique de PyTorch ou TensorFlow Capacité avérée à concevoir, entraîner et déployer des modèles ML complexes dans des environnements multimodaux Solide base en analyse statistique et conception expérimentale Maîtrise de la manipulation de données avec SQL, Spark et pandas Expérience avec les infrastructures ML basées sur le cloud (ex. : AWS) Bonne compréhension des principes MLOps et des workflows CI/CD pour le ML Atouts Supplémentaires Expérience avec TensorBoard pour la visualisation et le débogage des modèles Connaissance des outils de suivi des LLMs comme MLflow, LangFuse ou LangSmith Connaissance de LangChain ou de frameworks similaires pour les applications LLM Expérience en entraînement distribué pour les modèles à grande échelle Stack Technique Langages : Python (avancé), SQL Frameworks : PyTorch ou TensorFlow, Hugging Face Transformers Outils de données : Spark, pandas, NumPy MLOps : MLflow, Kubeflow (ou équivalent) Visualisation : Matplotlib, Seaborn, Plotly Contrôle de version : Git, DVC Cloud : AWS Conteneurisation : Docker, Kubernetes