Le poste Data engineer PySpark H/F
Partager cette offre
Qui sommes-nous ?
Chez AMD Blue, l'innovation est notre passion, et nous sommes fiers de présenter Blue Data, notre Tribu spécialisée dans le domaine de la Data. Avec une présence établie sur l'ensemble du territoire français et une récente expansion aux États-Unis et au Canada, nous sommes résolument tournés vers l'avenir.
Dans le cadre d’un besoin client, nous avons l'opportunité d'accueillir un nouveau membre au sein de notre Tribu Blue Data.
Contexte de la mission :
L'équipe Data Forecast a pour mission de mettre à disposition dans le Datalake de notre client , les datasets qui concernent les prévisions de ventes.
Vous participerez donc au produit Forecast. L'équipe est constituée de Data Engineer.
L’équipe travaille avec l'équipe de Data Scientists, afin de calculer les prévisions de ventes dans le but de correctement les réapprovisionner.
Les indicateurs sont utilisés par la production, la Supply Chain, le retail ou encore la finance. En lien avec les Data Scientists l’équipe utilise des algorithmes de Machine Learning pour calculer les prévisions.
Détail de la mission :
Afin de se renforcer, notre client souhaite intégrer un(e) Data Engineer maitrisant(e) qui nous aidera à construire de nouveaux indicateurs et à les fiabiliser.
Pour remplir à bien sa mission, le/la Data Engineer devra :
- Comprendre un modèle de données et s'en servir,
- Aider l'équipe à faire les meilleurs choix techniques,
- Apporter une expertise sur la conception des indicateurs,
- Maîtriser les bases de données et les outils de transformation,
- Être capable de transformer une donnée brute en un indicateur.
Stack technique de l’équipe :
- Transformation de données : PySpark, Pandas
- Langages : Python, SQL
- BDD : Databricks SQL Warehouse
- Datalake : AWS S3
- Versionning, CI/CD : GitHub, GitHub Actions
- Ordonnanceur : Airflow
- Cluster : AWS EMR
Profil recherché
Ø Vous êtes diplômé(e) d'une école d’ingénieur ou d’un master dans un domaine lié à la Data et à l’informatique
Ø Vous avez minimum 2 ans d’expériences professionnelles en tant que Data Engineer
Ø Vous avez un bon niveau en anglais à l’oral comme à l’écrit ( échange avec des équipes à l’international)
Ø Vous êtes passionné(e) par la data
Ø Vous maitrisez parfaitement PySpark et Airflow
Ø Vous avez déjà travaillé(e) sur la stack AWS (S3, ECR, CodeArtefact, EMR) et vous maitrisez ces composants.
Ø Vous aimez travailler en agilité dans un environnement collaboratif (GitHub, SCRUM).
Ø En lien avec les autres Data Engineers de l'équipe, la connaissance de Databricks est appréciée.
Environnement de travail
Mission en régie via AMD Blue Data
Secteur d’activité : Retail
Lieu : Lille
Déplacements possibles à : NR
Télétravail : partiel
Durée : 2 ans
Démarrage possible : fin septembre / début octobre
Postulez à cette offre !
Trouvez votre prochaine mission parmi +7 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Data engineer PySpark H/F
AMD Blue