Description

Data Engineer | Expert Databricks, Spark, Azure, AWS | 9 ans d'expérience

👋 Je suis Senior Data Engineer spécialisé Azure & AWS

Avec 9 ans d'expérience dans le développement de projets Big Data et Cloud, j'interviens auprès de grandes entreprises pour concevoir, construire et optimiser leurs plateformes data.

🚀 Références clients :

TF1

TotalEnergies

AXA Direct Assurance

Société Générale

✅ Ce que je vous apporte :

🔷 Expertise Cloud & Data

Design & choix d’architectures data
Mise en place de data lakes, entrepôts de données, lakehouses
Intégration & traitement de données à grande échelle

🔷 Développement & Administration Big Data

Spark (Scala / Python/ SQL)
Databricks (admin, dev, CICD avec Databricks bundles)

🔷 Plateformes Cloud :

Azure : Data Factory, Databricks, Synapse, Fabric
AWS : Glue, S3, EMR, EC2, Lambda

🔷 Mise en place de CICD & Infrastructure as Code

Azure DevOps
Terraform
Databricks bundles

💡 Ce que je privilégie :

Une approche agile
Un planning maîtrisé
Le respect des deadlines

📩 Discutons de votre projet !

Je suis disponible pour échanger directement ici sur Malt.

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km), Nice (jusqu’à 50 km), Toulouse (jusqu’à 50 km), Bordeaux (jusqu’à 50 km), Lyon (jusqu’à 50 km)

TF1
Data Engineer / Architect Data Plateform
PRESSE & MÉDIAS
septembre 2024 - Aujourd'hui (1 an et 9 mois)
Boulogne-Billancourt, France
Contexte:

Accompagnement de TF1 dans la conception, la mise en place et l’industrialisation de sa plateforme Data & Cloud pour répondre aux enjeux de gouvernance, performance et scalabilité.

Contributions principales:

🏗 Architecture Data & Cloud :

Design d’architecture sur Azure & Databricks alignée avec les besoins métiers et techniques,
Réalisation de POCs et benchmarks pour sélectionner les solutions les plus adaptées.
Microsoft Fabric : test et mise en place d’un prototype de migration de workloads SQL vers Fabric, incluant la reprise de tables, la transformation des données et l’optimisation des performances dans une architecture Data Lakehouse moderne.

⚙️ Infrastructure as Code :

Déploiement de modules Terraform pour industrialiser la plateforme:
Mise en place d'un module Unity Catalog (Databricks) pour la gouvernance des données.
Définition des accès via un module : Databricks Access Matrix.

🔄 CI/CD & automatisation :

Création de pipelines CI/CD pour déploiements automatisés (Terraform & Databricks Bundles).
🤝 Collaboration & best practices :

Accompagnement des équipes Data & BI sur les bonnes pratiques (gouvernance, sécurité, performance).
Montée en compétences des équipes internes sur les nouveaux outils: Terraform & Spark

⚡ Optimisation Data :

Amélioration des workflows de traitement Databricks.
Optimisation continue de la plateforme pour gagner en fiabilité et en efficacité.

Résultats:

Mise en place d’une plateforme Data & Cloud robuste, sécurisée et gouvernée, adaptée aux enjeux stratégiques d’un grand groupe média.
Automatisation des déploiements réduisant les erreurs manuelles et accélérant la mise en production.
Terraform Data gouvernance Databricks Architecture Spark
TotalEnergies
AWS/Azure Senior Data Engineer
ENERGIE
juin 2023 - août 2024 (1 an et 3 mois)
Paris, France
Contexte:
Participation à un projet visant à localiser et suivre en temps réel les bornes de recharge pour véhicules électriques, afin d’améliorer l’expérience des conducteurs.

Contributions principales:

🛠 Infrastructure as Code : mise en place de l’environnement Databricks (workspaces, rôles IAM, intégration avec S3 et calcul AWS EC2) via Terraform.

🔄 CI/CD & industrialisation : automatisation avec Databricks Bundles pour déployer les clusters, configurer les jobs et intégrer le code Spark (Python).

📊 Architecture data : conception et implémentation du Data Lakehouse avec les différentes couches (Bronze, Silver, Gold) pour assurer qualité et gouvernance des données.

⚡ Pipelines de données :

Traitement batch (Bash + Spark) exécuté chaque nuit pour alimenter les tables de l’API de géolocalisation,

Traitement temps réel pour mettre à jour instantanément le statut des bornes.

Résultat:
Mise en place d’une plateforme data robuste, automatisée et scalable, permettant une géolocalisation fiable et une mise à jour en temps réel des bornes de recharge, au service des conducteurs de véhicules électriques.
Databricks Terraform Azure Synapse AWS Lambda PostgreSQL
AXA
Azure Sr Data Engineer
BANQUE & ASSURANCES
décembre 2021 - mai 2023 (1 an et 6 mois)
Suresnes, France
Contexte:

Pilotage de la migration d’un Data Lake on-premise vers Azure Cloud, avec la conception et la mise en place d’une architecture moderne de Data Lakehouse pour supporter des besoins analytiques et de business intelligence à grande échelle.

Contributions principales:

🔄 Ingestion & intégration des données : conception et implémentation de pipelines de bout en bout avec Azure Data Factory, Databricks & Spark pour une intégration fluide et automatisée.

📊 Transformation & reporting : développement de workflows de transformation et création de vues métiers fiables, garantissant un reporting de haute qualité.

🏗 Architecture Lakehouse : mise en place d’un Delta Lakehouse sur Azure Databricks, assurant cohérence, scalabilité et gouvernance des données.

⚙️ DevOps & industrialisation : adoption des pratiques Azure DevOps (Pipelines, Releases) pour automatiser les déploiements et renforcer la collaboration entre équipes.

⚡ Optimisation des performances : mise en œuvre de techniques avancées sur Azure Databricks (optimisation Spark, Z-Order, Vacuum, gestion du Delta Lake) afin d’améliorer l’efficacité des traitements et réduire les coûts de calcul.

Résultats :

Migration réussie d’un environnement on-premise vers une plateforme cloud scalable et gouvernée.

Accélération des déploiements grâce à l’automatisation CI/CD.

Mise à disposition d’une architecture fiable permettant des analyses et reportings de qualité, tout en réduisant les coûts d’exploitation.
Azure Data Factory Databricks Scala Azure DevOps Deltalake

Consulter toutes les expériences de Rabeh

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master Big Data
Université Jean Monnet
2016
Master 2 Big Data
Formation Cloudera & Certificat Spark and Hadoop Developer
Xebia
2017
Formation Cloudera & Certificat Spark and Hadoop Developer

Certificat Spark and Hadoop Developer
Xebia
2017
https://certification.cloudera.com/verify/
Hive Sqoop Scala Hadoop HDFS Apache Kafka Spark Yarn

Cloud Engineer & Architect

Rabeh Aloui

Data Engineer | Databricks | Spark | Azure | AWS

À propos de Rabeh

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories