You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Michaël RabeMR

Michaël Rabe

Senior Data Engineer GCP

750 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Michaël

💾 Data Engineer | BigQuery | GCP | Airflow | DBT

🔹 Data Engineer avec 6 années d’expérience, j’accompagne les entreprises dans la conception, l’optimisation et l’industrialisation de leurs pipelines de données sur GCP.

🔹 Expertise technique
✅ ETL/ELT : Airflow, Dataflow, Cloud Run Jobs
✅ Stockage & Modélisation : BigQuery, DBT
✅ Qualité & Monitoring : Soda Core, Dataform
✅ Développement : Python, SQL, Bash
✅ CI/CD & DevOps : GitLab, Docker

🔹 Ma mission ?
🚀 Automatiser et fiabiliser vos flux de données
📊 Structurer votre data warehouse pour des analyses performantes
⚡ Optimiser l’ingestion et le traitement des données pour plus d’efficacité

📩 Contactez-moi et discutons de vos enjeux !
  • Français

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km), Rennes (jusqu’à 50 km), Paris (jusqu’à 50 km)

Expériences

  • Le Groupe Bel
    Senior Data Engineer
    AGROALIMENTAIRE
    septembre 2025 - Aujourd'hui (9 mois)
    - Conception de pipelines data sur GCP (BigQuery, GCS, Airflow)
    - Développement Python + orchestration avec Apache Airflow
    - Containerisation avec Docker et déploiement Cloud Run
    - CI/CD et infra as code avec Terraform
    - Optimisation BigQuery (modélisation, performance, coûts)
    - DBT
    BigQuery DBT Python Big Query Terraform
  • Groupe Le Duff
    Data Engineer
    AGROALIMENTAIRE
    février 2024 - septembre 2025 (1 an et 7 mois)
    • Contexte :
    Modernisation de l’infrastructure data sur GCP.

    • Objectifs :
    Mettre en place des pipelines de données automatisés et scalables.
    Optimiser les flux ELT avec Apache Airflow.
    Structurer la modélisation des données avec DBT dans BigQuery.

    • Réalisations :
    Développement de workflows Airflow pour orchestrer l’ingestion, la transformation et le chargement des données.
    Création de modèles DBT assurant qualité, cohérence et traçabilité des datasets.
    Optimisation des coûts BigQuery :
    ▸ Utilisation de tables partitionnées et clusterisées
    ▸ Réécriture et tuning des requêtes SQL
    Collaboration avec les équipes métiers pour aligner les solutions data sur les besoins opérationnels.

    • Stack :
    GCP (BigQuery, Cloud Storage, Job Cloud Run) • Apache Airflow • DBT • Python • SQL • Docker • Git • CI/CD
    Google cloud Airflow DBT Python Docker
  • Avisia
    Data Engineer
    octobre 2022 - février 2024 (1 an et 4 mois)
    Nantes, France
    • Contexte : Data Engineer SNCF G&C - Equipe Data Plateform
    • Réalisations clés :
    Ingestion de données dans le Data Lake à l’aide de pipelines Azure Data Factory (ADF).
    Traitement des données avec Databricks et PySpark.
    Création de rapports Power BI connectés à des jeux de données optimisés.
    Surveillance et fiabilisation des flux de bout en bout.

    • Stack : Azure (ADF, Databricks), PySpark, Python, Power BI
    ——————————————————————————————
    • Contexte : Data Engineer - Dans le retail
    • Réalisations clés :
    Développement de pipelines de contrôle qualité dans Dataiku DSS, avec automatisation des règles de validation et détection d’anomalies.
    Sur GCP, ingestion et orchestration des traitements des données post-migration via airflow,
    BigQuery pour les contrôles à grande échelle.
    Construction de dashboards Looker de suivi des écarts et des taux de conformité.
    Documentation des processus et mise en place d’un monitoring régulier des flux de validation.
    • Stack : GCP (BigQuery, Cloud Storage, Cloud Functions), Dataiku DSS, Python

    ——————————————————————————————
    • Contexte : Data Engineer SNCF G&C - Equipe Data Marketing
    • Réalisations clés :
    Ingestion de données externes via API pour enrichissement des datasets clients.
    Développement d’analyses géospatiales et marketing.
    Automatisation de l’ingestion avec ADF et visualisation via Power BI.
    Industrialisation des traitements avec Databricks et PySpark.
    • Stack : Azure (ADF, Databricks), PySpark, Python, API, Power BI
    Microsoft Azure Azure Data Factory Databricks Python PySpark

Recommandations

Soyez le premier à recommander Michaël

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master 2 (M2), Statistiques-économétrie
    Université de Rennes I
    2018
    Master 2 (M2), Statistiques-économétrie
  • L3 Mathématiques - Economie
    Université de Rennes I
    2016
    L3 Mathématiques - Economie

Compétences

Catégories