Le poste Lead Data GCP Python Power BI
Partager cette offre
Nous recherchons un(e) Lead Data Engineer expérimenté(e) pour rejoindre une équipe digitale dynamique dédiée à la gestion des données. Vous serez en charge de l’industrialisation de l’infrastructure data, ainsi que de la qualité, de la sécurité, et du respect de la vie privée des données. Vous travaillerez sur des environnements Cloud (GCP et AWS) et piloterez une équipe de 2 Data Engineer.
Mise en place d’environnements cloisonnés (Dev, Préprod, Production).
Automatisation du déploiement et de la maintenance via des outils Infrastructure as Code (Terraform).
Implémentation de solutions d’observabilité (monitoring, alerting).
Maintenance et développement de pipelines de données en Python (batch et streaming).
Création de pipelines SQL/SQLX avec Data-Form (similaire à DBT).
Déploiement et gestion d’un outil de data quality (ex. Great Expectations).
Développement de workers AWS pour gérer les flux entre Kafka et Pub Sub sur GCP.
Connaissance de DataFlow (Apache Beam) appréciée.
Standardisation du code avec linting, CI/CD et divers tests.
Documentation des processus internes et schémas d’architecture.
Coopération avec les équipes Data (analystes, SEO/SEA, emailing).
Respect du RGPD avec anonymisation et archivage des données.
Sécurisation de l’infrastructure, des données et du code
Profil recherché
De formation Bac+5 minimum au sein d'une école d'ingénieur ou d'informatique, vous avez une expérience de 5 ans minimum en tant que Lead Data GCP Python Power BI.
Environnement de travail
Stack technique : Google Cloud Platform (GCP), BigQuery, Data-Form, Cloud DataFlow, Cloud Pub Sub, Notebooks Python, Looker Studio, Power BI.
Une bonne maîtrise des langages Python et SQL est indispensable.
De l’expérience en développement de code collaboratifs (dev Ops.) est souhaitée.
Une connaissance minimum des technologies de streaming (Apache Beam, DataFlow, Kafka, PubSub, SNS/SQS) est nécessaire.
De l’expérience spécifique sur BigQuery est fortement recommandée
Une connaissance des outils de GCP (ou cloud équivalent) est fortement recommandée
De l’expérience sur des ETL (transformation de données) est fortement recommandé
De l’expérience dans l’utilisation d’outil de transformation de données comme des ETLs (Cloud DataPrep, Datai Ku, Aptéryx ou autre) sont un plus
Des connaissances en machine learning sont un plus
Postulez à cette offre !
Trouvez votre prochaine mission parmi +6 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Lead Data GCP Python Power BI
HIGHTEAM