Le poste Ingénieur fiabilité des sites (SRE)
Partager cette offre
En tant que SRE, vos missions seront de :
Prendre en charge le run et la supervision des systèmes :
Gérer les incidents en production et assurer le maintien en conditions opérationnelles (MCO) des environnements clients (AWS, Kubernetes, on-premise).
Développer des processus pour la gestion proactive des incidents (prévention, alertes, escalades).
Travailler à la réduction du "toil" en automatisant les tâches répétitives et les processus manuels liés au run.
Superviser et optimiser la fiabilité des systèmes :
Mettre en place et maintenir des outils de supervision, monitoring et alerting (Prometheus, Grafana, ELK, etc.).
Garantir la disponibilité et la performance des systèmes grâce à des indicateurs SLA, SLO et SLI.
Identifier les points de contention et proposer des optimisations pour garantir la scalabilité et la résilience des infrastructures.
Développer l’automatisation des pipelines CI/CD et améliorer les processus de déploiement
Participer à l’évolution des chaînes CI/CD et du patrimoine applicatif pour tendre vers un déploiement continu (Continuous Deployment).
Standardiser les pipelines d’intégration et de livraison pour qu’ils répondent aux besoins des équipes produit et intégration.
Contribuer à la fiabilité et la cohérence des déploiements sur des environnements variés (AWS, Kubernetes, on-premise) en appui du Lead Dev.
Participer aux projets de migration
Apporter une expertise technique pour migrer nos clients vers AWS ou des hébergeurs SecNumCloud.
Contribuer à la mise en oeuvre d’architectures robustes et scalables adaptées à chaque environnement client en appui aux équipes architectes.
Collaborer avec les équipes pluridisciplinaires :
Accompagner l’équipe d’intégration dans le déploiement des solutions sur les contextes clients.
Travailler avec l’équipe architecture pour standardiser et optimiser les bonnes pratiques.
Soutenir l’équipe produit dans la mise en place d’environnement de travail adapté.
Profil recherché
Cloud : Expertise avec AWS (EC2, S3, RDS, EKS, etc.) et bonne compréhension des enjeux multi-clouds et hybrid-clouds.
Conteneurs et orchestration : Maîtrise de Kubernetes et des environnements conteneurisés (Docker).
Run et exploitation : Expérience dans la gestion du MCO et de la production dans des environnements complexes.
Infrastructure as Code : Expérience avec Terraform, Ansible ou équivalent.
Observabilité : Compétence sur des outils comme Prometheus, Grafana, ELK, ou équivalents.
CI/CD : Connaissance approfondie des outils comme GitLab CI, ou équivalents, avec une expérience dans l’évolution vers le déploiement continu.
Langages : Bonne maîtrise de langages de scripting (Python, Bash) et compréhension des bases de développement logiciel.
Environnement de travail
Compétences comportementales
Capacité à résoudre des problèmes complexes, y compris en situation d’urgence.
Fort esprit collaboratif et capacité à se coordonner avec plusieurs équipes.
Orientation résultat et volonté d’améliorer les processus existants.
Capacité à s’adapter rapidement à des environnements techniques variés.
Formation supérieure en informatique (Bac+5 ou équivalent).
Expérience de 3 à 5 ans dans un rôle similaire (SRE, DevOps, ou Ingénieur système avec une forte dimension opérationnelle).
Postulez à cette offre !
Trouvez votre prochaine mission parmi +7 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Ingénieur fiabilité des sites (SRE)
HAYS France