Description

Vous recherchez un Data Engineer Senior pour industrialiser vos pipelines à grande échelle, refondre votre plateforme data sur Databricks ou intégrer l'IA générative dans vos workflows ?

Diplômé Ingénieur Mines-Télécom (ENSSAT Lannion), 8 ans d'expérience en Data Engineering. J'ai travaillé pour AXA France, Danone, Afflelou, STIME (Mousquetaires), CNP Assurances et Fludia. Tech Lead depuis 3 ans, certifié Databricks Professional Data Engineer, Azure Data Engineer Associate (DP-203) et Databricks Spark 3.0.

Je vous accompagne sur :

• Pipelines ETL / ELT industrialisés sur Databricks et Apache Spark (PySpark, Spark SQL).

• Architecture Lakehouse Médaillon (Bronze / Silver / Gold), Delta Lake, Unity Catalog.

• Optimisation Spark avancée : partitioning, joins, gestion du skew, tuning mémoire.

• CI/CD sur Azure DevOps, GitHub Actions, Databricks Repos, dbx.

• Architecture cloud Azure et AWS, démarche FinOps.

• Intégration IA générative pour améliorer la productivité.

• Encadrement technique : code review, cadrage, montée en compétences juniors.

Track record :

- Refonte de la plateforme data Azure du Groupe Afflelou : -30 % de coûts cloud.

- Plateforme NLP multi-langues chez Danone : 50 000 verbatims RH par mois sur 15+ langues.

- Modernisation des flux comptables critiques chez AXA : -20 % de temps de traitement.

- Stack AI Coding chez STIME : skills Claude Code et prompts pour accélérer l'onboarding et le delivery data.

Stack : Databricks, PySpark, Apache Spark, Delta Lake, Unity Catalog, Lakehouse, Médaillon, Python, SQL. Azure (ADF, Synapse, ADLS Gen2, Event Hubs, Stream Analytics, Key Vault, Azure DevOps, Azure OpenAI). AWS (S3, EMR, Glue, Lambda, Step Functions, Athena). Apache Kafka, Airflow, Stonebranch, GitHub Actions, Docker. MLflow, scikit-learn, TensorFlow, Hugging Face, NLP, LLM. Power BI, DAX. Agile, Scrum, Tech Lead, FinOps.

Échangeons sur votre projet : contactez-moi directement via Malt.

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Espagnol
Notions

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km), Lyon (jusqu’à 50 km), Bordeaux (jusqu’à 50 km), Marseille (jusqu’à 50 km), Nantes (jusqu’à 50 km)

Stime DSI Groupement Les Mousquetaires
Senior Azure Data Engineer
GRANDE DISTRIBUTION
septembre 2024 - février 2025 (5 mois)
Châtillon, France
La STIME est la filiale informatique du Groupement Les
Mousquetaires (Intermarché, Bricomarché, Netto), avec plus de
1 000 collaborateurs supportant 4 000+ points de vente en Europe.

J'ai rejoint l'équipe Data Engineering pour le projet stratégique
Da Vinci, avec deux objectifs : industrialiser la structuration
des données pour les équipes métier, et mettre en place des KPI
Power BI à destination des directeurs de point de vente.

Au sein d'une équipe Agile de 10 personnes (3 PO, 1 Scrum Master,
3 Data Analysts, 1 QA, 2 Data Engineers), je pilote l'architecture
data Azure / Databricks et j'encadre les Data Engineers juniors.

Responsabilités :

• Conception et développement de pipelines ETL/ELT sur Azure Data
Factory et Azure Databricks.
• Architecture Lakehouse selon l'approche Médaillon
(Bronze/Silver/Gold) avec Delta Lake.
• Optimisation Spark avancée des workloads PySpark : partitioning,
joins, skew, tuning mémoire, cache.
• Mise en place de standards et bonnes pratiques de code PySpark.
• Monitoring et support en production via Azure Log Analytics et
Azure Monitor.
• Code review et validation des pull requests sur Azure DevOps,
encadrement technique des juniors.
• Développement de skills Claude Code pour accélérer l'onboarding,
le traitement des tickets JIRA et la documentation.

Résultats :

• -35 % de temps de traitement des pipelines grâce à
l'optimisation Spark.
• -30 % sur les coûts d'infrastructure Azure (FinOps).
• Montée en compétences de l'équipe sur Databricks et PySpark.

Stack : Azure Databricks, Databricks Notebooks, Delta Lake,
Lakehouse, Médaillon, PySpark, Apache Spark, Spark SQL, Python,
Azure Data Factory, ADLS Gen2, Azure Monitor, Azure Log Analytics,
Azure SQL, Azure DevOps, CI/CD, FinOps, Power BI, ETL/ELT, Data
Warehouse, Claude Code, AI Coding, JIRA, Confluence, Data Galaxy,
Tech Lead, Code Review, Agile, Scrum.
Azure Data Factory Azure Databricks SQL Server Cloud Azure Databricks
AXA France
Senior Data Engineer
BANQUE & ASSURANCES
février 2024 - septembre 2024 (7 mois)
Nanterre, France
AXA France est un leader mondial de l'assurance avec plus de
150 000 collaborateurs dans 50+ pays et plusieurs milliards
d'euros de chiffre d'affaires.

J'ai intégré la guilde Data (40+ ingénieurs) sur un projet
stratégique de modernisation des flux de données comptables
critiques et de fiabilisation du reporting financier à grande
volumétrie. Collaboration étroite avec les équipes Finance et IT
sur l'écosystème Azure et Apache Spark.

Responsabilités :

• Utilisation et optimisation de Carbon (framework propriétaire
AXA basé sur Apache Spark) pour l'ingestion et la transformation
des données comptables.
• Conception et implémentation de pipelines ETL/ELT sur Azure Data
Factory et Azure Databricks.
• Architecture Lakehouse selon l'approche Médaillon
(Bronze/Silver/Gold) avec Delta Lake sur ADLS Gen2, implémentée
via Carbon.
• Implémentation de workflows event-driven entre Apache Kafka,
Azure Event Hubs et Databricks.
• Optimisation Spark avancée : réduction mémoire, parallélisation,
partitioning, joins.
• Automatisation des déploiements via Azure DevOps (CI/CD).
• Monitoring des pipelines en production via Azure Monitor.
• Standardisation des pratiques de développement Spark au sein de
la guilde Data.
• Formation des équipes comptables sur les nouvelles sources de
données.

Résultats :

• -20 % de temps de traitement des données financières.
• -35 % sur les coûts d'infrastructure grâce à l'optimisation
Spark (FinOps).
• Standardisation des pratiques Spark adoptée par l'ensemble de
la guilde Data.

Stack : Azure Databricks, PySpark, Apache Spark, Spark SQL,
Carbon, Delta Lake, Lakehouse, Médaillon (Bronze/Silver/Gold),
Python, SQL, Azure Data Factory, ADLS Gen2, Azure Event Hubs,
Apache Kafka, Azure Monitor, Azure DevOps, CI/CD, FinOps,
ETL/ELT, Data Warehouse, Confluence.
Azure Databricks PySpark Azure Data Factory Cloud Azure Azure Data Lake
GROUPE AFFLELOU
⚡ Tech Lead Data Engineer
COMMERCE DE DÉTAIL
octobre 2022 - février 2024 (1 an et 4 mois)
Paris, France
Le Groupe Afflelou est un leader européen de l'optique avec plus
de 1 500 points de vente dans 8 pays et plus d'1 Md€ de chiffre
d'affaires.

J'ai rejoint le département IT comme Lead Data Engineer pour
piloter la transformation digitale du groupe : modernisation de
l'architecture data, optimisation des coûts cloud et
internationalisation de la plateforme. Organisation multi-équipes
(plateforme data centrale et feature teams analytiques métier).

Responsabilités :

• Refonte de la plateforme data sur Azure : architecture Data Lake
standardisée (ADLS Gen2) pour l'ensemble du groupe.
• Architecture Lakehouse Delta Lake selon l'approche Médaillon
(Bronze/Silver/Gold).
• Pipelines ETL/ELT avec Azure Data Factory et Azure Databricks.
• Optimisation Spark avancée (PySpark) : partitioning, joins,
cache, tuning clusters.
• Ingestion end-to-end Google Analytics + flux de 1 500+ points
de vente (10+ GB/jour).
• Pilotage FinOps : analyse des workloads, redesign clusters,
optimisation des coûts cloud.
• Monitoring multi-environnements (PRD / PPD / DEV / SBX).
• CI/CD complète via Azure DevOps et Databricks Repos.
• Provisionnement Azure pour le marché espagnol, accès via Active
Directory.
• Développement d'APIs via Azure Functions et Azure API Management.
• Animation de l'équipe Data Engineering, coaching sur Databricks
et Azure.

Résultats :

• -30 % de coûts d'infrastructure cloud (FinOps).
• -30 % de temps de traitement des pipelines.
• -70 % de délais de déploiement (CI/CD).
• +10 GB/jour ingérés et centralisés (1 500+ points de vente).
• Autonomisation des équipes analytiques métier.
• Déploiement international réussi sur le marché espagnol.

Stack : Azure Databricks, Delta Lake, Lakehouse, Médaillon
(Bronze/Silver/Gold), PySpark, Apache Spark, Spark SQL, Python,
SQL, Azure Data Factory, ADLS Gen2, Azure Synapse Analytics,
Azure Functions, Azure API Management, Azure DevOps, Active
Directory, CI/CD, FinOps, Power BI, ETL/ELT, Tech Lead, Code
Review.
Databricks Azure DevOps SQL Azure Databricks Optimisation

Consulter toutes les expériences de Ange

Aucun détail d’avis à afficher

Ange a choisi de conserver les avis qui lui ont été laissés confidentiels.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Diplôme d'Ingénieur
ENSSAT - École Nationale Supérieure des Sciences Appliquées et de Technologie
2017
Diplôme d'Ingénieur, Institut Mines-Télécom — ENSSAT Lannion. Spécialisation : Systèmes Numériques et Machine Learning. Formation en traitement du signal, programmation, statistiques, IA, électronique embarquée.
Classes préparatoires PTSI/PT
Saint Aubin La Salle
2014
Mathématiques, Sciences Physiques, Sciences Industrielles

Databricks Certified Data Engineer Professional
DATABRICKS
2024
https://credentials.databricks.com/09079cea-a0b8-4386-bd69-3907d7e77be5#acc.cnrbhpIJ
Optimisation PySpark Delta Lake Data Engineer Azure Databricks Data processing ETL Unity Catalog Apache Spark Pipeline
Microsoft Certified: Azure Data Engineer Associate
Microsoft
2023
https://www.credly.com/badges/8aa08f50-d275-44a8-b1b8-2c542d2d2628/linked_in_profile
Azure Data Factory Azure Datalake Cloud Engineer Azure Synapse Analytics PySpark Azure Key Vault Azure Data Lake Azure Databricks Azure Stream Analytics Python

Les certifications de Ange sont accessibles uniquement aux membres Malt

Cloud Engineer & Architect

Ange Kouame

Big Data Engineer - Databricks, PySpark, Azure/AWS

À propos de Ange

Expériences

Avis

5,0

Qualité

5,0

Délai

5,0

Communication

5,0

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories