Offres

Forum

Index des forums

Mes sujets favoris

Les sujets auxquels je participe

Les derniers sujets

Les sujets les plus discutés

Blog

Ressources

Baromètre IT

Rémunérations IT

Vos contributions

Annuaire des recruteurs IT

Simulation de revenu

Je suis recruteur

Connexion Inscription

Offre d'emploi MLOPS (H/F)

Paris

SCALIAN

Docker

Kubernetes

Machine Learning

Le poste MLOPS (H/F)

CDI

Freelance

12 mois

70k-80k €⁄an, 650-690 €⁄j

5 à 10 ans d’expérience

Télétravail partiel

Paris, France

Publiée le 25/11/2024

Partager cette offre

Vous êtes passionné(e) par les technologies de l'intelligence artificielle générative et maîtrisez les outils modernes d’orchestration et de distribution ? Nous recherchons un(e) LLM Ops Engineer pour optimiser et déployer des modèles de langage (LLM) à grande échelle en environnement distribué.

Vous jouerez un rôle clé dans la mise en production et la gestion des pipelines complexes, en exploitant des frameworks tels que TGI (Text Generation Inference), VLLM, et BentoML, dans un contexte basé sur Docker, Kubernetes, et le cloud computing.

Gestion et optimisation des LLM :
- Implémenter et déployer des modèles d'IA générative (GPT, BERT, autres LLM).
- Optimiser les performances des modèles grâce à des frameworks comme TGI ou VLLM.
- Assurer la scalabilité des services d’inférence via des architectures distribuées.
Infrastructure et conteneurisation :
- Construire, tester et déployer des conteneurs Docker pour les environnements IA.
- Configurer et maintenir des clusters Kubernetes pour l’orchestration des services d’inférence.
- Automatiser les workflows CI/CD pour la mise en production rapide des modèles.
Distribution parallélisée :
- Gérer la parallélisation des charges de travail LLM sur des architectures multi-nœuds.
- Optimiser l’utilisation des GPU/TPU pour maximiser les performances.
- Implémenter des solutions de streaming et de traitement par lots pour les données d'entrée/sortie des modèles.
Observabilité et monitoring :
- Déployer des outils de monitoring (Prometheus, Grafana) pour surveiller les performances des LLM.
- Identifier les goulots d'étranglement et proposer des améliorations continues.

Profil recherché

Formation supérieure en informatique, mathématiques appliquées ou IA.
Expérience significative dans le déploiement d’applications IA à grande échelle.
Forte appétence pour les technologies émergentes et l’innovation.
Capacité à travailler en équipe dans un environnement Agile/DevOps.

Environnement de travail

Technologies IA :
- Expérience avec les frameworks de LLM : TGI, VLLM, Hugging Face Transformers, TensorFlow Serving.
- Connaissance des outils d’inférence rapide comme ONNX Runtime, Triton Inference Server.
Conteneurisation et orchestration :
- Maîtrise de Docker et Kubernetes.
- Expérience avec Helm Charts et la gestion de clusters K8s.
Langages et scripting :
- Solide maîtrise de Python (PyTorch, TensorFlow) et de Bash.
- Connaissance des API REST/GraphQL pour interfacer les modèles.
Infrastructure :
- Expérience avec des plateformes cloud (AWS, Azure, GCP) et outils associés (EKS, AKS, GKE).
- Connaissance des environnements distribués pour le calcul parallèle (Ray, Dask).
Atouts supplémentaires :
- Familiarité avec BentoML pour le packaging et le déploiement des modèles.
- Expérience dans la gestion des bases de données vectorielles (Pinecone, Weaviate, FAISS).
- Connaissance en sécurité des données (chiffrement, GDPR).

Découvrir SCALIAN

Toulouse, Occitanie

> 1 000 salariés

ESN

Dans le TOP10 des Sociétés de Conseil en Ingénierie en France, le Groupe intervient sur des activités de services en management de projets industriels, supply chain, architecture et développement de systèmes numériques embarqués, applicatifs de systèmes d'information et d'Intelligence Artificielle dans des secteurs d’activité aussi variés que l’aéronautique, le spatial, l’automobile, le ferroviaire, les services, le luxe ou le retail… Créée en 1989, SCALIAN compte aujourd’hui plus de 5500 collaborateurs répartis dans 11 pays et 15 implantations en France pour un chiffre d’affaires de 550 millions d’euros. SCALIAN travaille pour des grands Groupes du CAC40 sur des projets en AT ou au forfait. Labellisée Grate Place to Work, SCALIAN connait une croissance de 20% chaque année. Pourquoi SCALIAN ? • Parce que Scalian vous accompagne dans le développement de votre carrière : Programme d'onboarding complet sur 1 an avec votre manager et votre RH, programmes de formation personnalisés, communautés techniques, événements internes • Parce que Scalian favorise la Qualité de Vie au Travail : Certifications Great Place to Work® et Best Workplaces for Women, Prime de cooptation, prime vacances, Accord télétravail. • Parce que Scalian développe une politique RSE concrète et ambitieuse : Mobilité durable, Actions environnementales, Accord Handicap et mission handicap avec temps dédié

Postulez à cette offre !

Trouvez votre prochaine mission parmi +7 000 offres !

Fixez vos conditions

Rémunération, télétravail... Définissez tous les critères importants pour vous.
Faites-vous chasser

Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
100% gratuit

Aucune commission prélevée sur votre mission freelance.

MLOPS (H/F)

SCALIAN

Profil recherché

Environnement de travail

Découvrir SCALIAN

Trouvez votre prochaine mission parmi +7 000 offres !

Trouvez votre prochaine mission parmi +7 000 offres !