SCALIAN

Offre d'emploi MLOPS (H/F)

Paris

SCALIAN

Le poste

CDI
Freelance
12 mois
70k-80k €⁄an, 650-690 €⁄j
5 à 10 ans d’expérience
Télétravail partiel
Paris, France
Publiée le 25/11/2024

Partager cette offre

Vous êtes passionné(e) par les technologies de l'intelligence artificielle générative et maîtrisez les outils modernes d’orchestration et de distribution ? Nous recherchons un(e) LLM Ops Engineer pour optimiser et déployer des modèles de langage (LLM) à grande échelle en environnement distribué.

Vous jouerez un rôle clé dans la mise en production et la gestion des pipelines complexes, en exploitant des frameworks tels que TGI (Text Generation Inference), VLLM, et BentoML, dans un contexte basé sur Docker, Kubernetes, et le cloud computing.

  • Gestion et optimisation des LLM :

    • Implémenter et déployer des modèles d'IA générative (GPT, BERT, autres LLM).

    • Optimiser les performances des modèles grâce à des frameworks comme TGI ou VLLM.

    • Assurer la scalabilité des services d’inférence via des architectures distribuées.

  • Infrastructure et conteneurisation :

    • Construire, tester et déployer des conteneurs Docker pour les environnements IA.

    • Configurer et maintenir des clusters Kubernetes pour l’orchestration des services d’inférence.

    • Automatiser les workflows CI/CD pour la mise en production rapide des modèles.

  • Distribution parallélisée :

    • Gérer la parallélisation des charges de travail LLM sur des architectures multi-nœuds.

    • Optimiser l’utilisation des GPU/TPU pour maximiser les performances.

    • Implémenter des solutions de streaming et de traitement par lots pour les données d'entrée/sortie des modèles.

  • Observabilité et monitoring :

    • Déployer des outils de monitoring (Prometheus, Grafana) pour surveiller les performances des LLM.

    • Identifier les goulots d'étranglement et proposer des améliorations continues.

Profil recherché

  • Formation supérieure en informatique, mathématiques appliquées ou IA.

  • Expérience significative dans le déploiement d’applications IA à grande échelle.

  • Forte appétence pour les technologies émergentes et l’innovation.

  • Capacité à travailler en équipe dans un environnement Agile/DevOps.

Environnement de travail

  • Technologies IA :

    • Expérience avec les frameworks de LLM : TGI, VLLM, Hugging Face Transformers, TensorFlow Serving.

    • Connaissance des outils d’inférence rapide comme ONNX Runtime, Triton Inference Server.

  • Conteneurisation et orchestration :

    • Maîtrise de Docker et Kubernetes.

    • Expérience avec Helm Charts et la gestion de clusters K8s.

  • Langages et scripting :

    • Solide maîtrise de Python (PyTorch, TensorFlow) et de Bash.

    • Connaissance des API REST/GraphQL pour interfacer les modèles.

  • Infrastructure :

    • Expérience avec des plateformes cloud (AWS, Azure, GCP) et outils associés (EKS, AKS, GKE).

    • Connaissance des environnements distribués pour le calcul parallèle (Ray, Dask).

  • Atouts supplémentaires :

    • Familiarité avec BentoML pour le packaging et le déploiement des modèles.

    • Expérience dans la gestion des bases de données vectorielles (Pinecone, Weaviate, FAISS).

    • Connaissance en sécurité des données (chiffrement, GDPR).

Toulouse, Occitanie
> 1 000 salariés
ESN
Dans le TOP10 des Sociétés de Conseil en Ingénierie en France, le Groupe intervient sur des activités de services en management de projets industriels, supply chain, architecture et développement de systèmes numériques embarqués, applicatifs de systèmes d'information et d'Intelligence Artificielle dans des secteurs d’activité aussi variés que l’aéronautique, le spatial, l’automobile, le ferroviaire, les services, le luxe ou le retail… Créée en 1989, SCALIAN compte aujourd’hui plus de 5500 collaborateurs répartis dans 11 pays et 15 implantations en France pour un chiffre d’affaires de 550 millions d’euros. SCALIAN travaille pour des grands Groupes du CAC40 sur des projets en AT ou au forfait. Labellisée Grate Place to Work, SCALIAN connait une croissance de 20% chaque année. Pourquoi SCALIAN ? • Parce que Scalian vous accompagne dans le développement de votre carrière : Programme d'onboarding complet sur 1 an avec votre manager et votre RH, programmes de formation personnalisés, communautés techniques, événements internes • Parce que Scalian favorise la Qualité de Vie au Travail : Certifications Great Place to Work® et Best Workplaces for Women, Prime de cooptation, prime vacances, Accord télétravail. • Parce que Scalian développe une politique RSE concrète et ambitieuse : Mobilité durable, Actions environnementales, Accord Handicap et mission handicap avec temps dédié

Postulez à cette offre !

Trouvez votre prochaine mission parmi +7 000 offres !

  • Fixez vos conditions

    Rémunération, télétravail... Définissez tous les critères importants pour vous.

  • Faites-vous chasser

    Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.

  • 100% gratuit

    Aucune commission prélevée sur votre mission freelance.

MLOPS (H/F)

SCALIAN

Au service des talents IT

Free-Work est une plateforme qui s'adresse à tous les professionnels des métiers de l'informatique.

Ses contenus et son jobboard IT sont mis à disposition 100% gratuitement pour les indépendants et les salariés du secteur.

Free-workers
Ressources
A propos
Espace recruteurs
2024 © Free-Work / AGSI SAS
Suivez-nous