À propos de Rabeh
- Design & choix d’architectures data
- Mise en place de data lakes, entrepôts de données, lakehouses
- Intégration & traitement de données à grande échelle
- Spark (Scala / Python/ SQL)
- Databricks (admin, dev, CICD avec Databricks bundles)
- Azure : Data Factory, Databricks, Synapse, Fabric
- AWS : Glue, S3, EMR, EC2, Lambda
- Azure DevOps
- Terraform
- Databricks bundles
- Une approche agile
- Un planning maîtrisé
- Le respect des deadlines
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- TF1Data Engineer / Architect Data PlateformPRESSE & MÉDIASseptembre 2024 - Aujourd'hui (1 an et 9 mois)Boulogne-Billancourt, FranceContexte:Accompagnement de TF1 dans la conception, la mise en place et l’industrialisation de sa plateforme Data & Cloud pour répondre aux enjeux de gouvernance, performance et scalabilité.Contributions principales:🏗 Architecture Data & Cloud :
- Design d’architecture sur Azure & Databricks alignée avec les besoins métiers et techniques,
- Réalisation de POCs et benchmarks pour sélectionner les solutions les plus adaptées.
- Microsoft Fabric : test et mise en place d’un prototype de migration de workloads SQL vers Fabric, incluant la reprise de tables, la transformation des données et l’optimisation des performances dans une architecture Data Lakehouse moderne.
⚙️ Infrastructure as Code :- Déploiement de modules Terraform pour industrialiser la plateforme:
- Mise en place d'un module Unity Catalog (Databricks) pour la gouvernance des données.
- Définition des accès via un module : Databricks Access Matrix.
🔄 CI/CD & automatisation :- Création de pipelines CI/CD pour déploiements automatisés (Terraform & Databricks Bundles).
🤝 Collaboration & best practices :- Accompagnement des équipes Data & BI sur les bonnes pratiques (gouvernance, sécurité, performance).
- Montée en compétences des équipes internes sur les nouveaux outils: Terraform & Spark
⚡ Optimisation Data :- Amélioration des workflows de traitement Databricks.
- Optimisation continue de la plateforme pour gagner en fiabilité et en efficacité.
Résultats:- Mise en place d’une plateforme Data & Cloud robuste, sécurisée et gouvernée, adaptée aux enjeux stratégiques d’un grand groupe média.
- Automatisation des déploiements réduisant les erreurs manuelles et accélérant la mise en production.
- TotalEnergiesAWS/Azure Senior Data EngineerENERGIEjuin 2023 - août 2024 (1 an et 3 mois)Paris, FranceContexte:Participation à un projet visant à localiser et suivre en temps réel les bornes de recharge pour véhicules électriques, afin d’améliorer l’expérience des conducteurs.Contributions principales:🛠 Infrastructure as Code : mise en place de l’environnement Databricks (workspaces, rôles IAM, intégration avec S3 et calcul AWS EC2) via Terraform.🔄 CI/CD & industrialisation : automatisation avec Databricks Bundles pour déployer les clusters, configurer les jobs et intégrer le code Spark (Python).📊 Architecture data : conception et implémentation du Data Lakehouse avec les différentes couches (Bronze, Silver, Gold) pour assurer qualité et gouvernance des données.⚡ Pipelines de données :Traitement batch (Bash + Spark) exécuté chaque nuit pour alimenter les tables de l’API de géolocalisation,Traitement temps réel pour mettre à jour instantanément le statut des bornes.Résultat:Mise en place d’une plateforme data robuste, automatisée et scalable, permettant une géolocalisation fiable et une mise à jour en temps réel des bornes de recharge, au service des conducteurs de véhicules électriques.
- AXAAzure Sr Data EngineerBANQUE & ASSURANCESdécembre 2021 - mai 2023 (1 an et 6 mois)Suresnes, FranceContexte:Pilotage de la migration d’un Data Lake on-premise vers Azure Cloud, avec la conception et la mise en place d’une architecture moderne de Data Lakehouse pour supporter des besoins analytiques et de business intelligence à grande échelle.Contributions principales:🔄 Ingestion & intégration des données : conception et implémentation de pipelines de bout en bout avec Azure Data Factory, Databricks & Spark pour une intégration fluide et automatisée.📊 Transformation & reporting : développement de workflows de transformation et création de vues métiers fiables, garantissant un reporting de haute qualité.🏗 Architecture Lakehouse : mise en place d’un Delta Lakehouse sur Azure Databricks, assurant cohérence, scalabilité et gouvernance des données.⚙️ DevOps & industrialisation : adoption des pratiques Azure DevOps (Pipelines, Releases) pour automatiser les déploiements et renforcer la collaboration entre équipes.⚡ Optimisation des performances : mise en œuvre de techniques avancées sur Azure Databricks (optimisation Spark, Z-Order, Vacuum, gestion du Delta Lake) afin d’améliorer l’efficacité des traitements et réduire les coûts de calcul.Résultats :Migration réussie d’un environnement on-premise vers une plateforme cloud scalable et gouvernée.Accélération des déploiements grâce à l’automatisation CI/CD.Mise à disposition d’une architecture fiable permettant des analyses et reportings de qualité, tout en réduisant les coûts d’exploitation.
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Master Big DataUniversité Jean Monnet2016Master 2 Big Data
- Formation Cloudera & Certificat Spark and Hadoop DeveloperXebia2017Formation Cloudera & Certificat Spark and Hadoop Developer