You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Ange KouameAK

Ange Kouame

Supermalter

Big Data Engineer - Databricks, PySpark, Azure/AWS

720 €/jour
2 projets
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Ange

Vous recherchez un Data Engineer Senior pour industrialiser vos pipelines à grande échelle, refondre votre plateforme data sur Databricks ou intégrer l'IA générative dans vos workflows ?

Diplômé Ingénieur Mines-Télécom (ENSSAT Lannion), 8 ans d'expérience en Data Engineering. J'ai travaillé pour AXA France, Danone, Afflelou, STIME (Mousquetaires), CNP Assurances et Fludia. Tech Lead depuis 3 ans, certifié Databricks Professional Data Engineer, Azure Data Engineer Associate (DP-203) et Databricks Spark 3.0.

Je vous accompagne sur :

• Pipelines ETL / ELT industrialisés sur Databricks et Apache Spark (PySpark, Spark SQL).
• Architecture Lakehouse Médaillon (Bronze / Silver / Gold), Delta Lake, Unity Catalog.
• Optimisation Spark avancée : partitioning, joins, gestion du skew, tuning mémoire.
• CI/CD sur Azure DevOps, GitHub Actions, Databricks Repos, dbx.
• Architecture cloud Azure et AWS, démarche FinOps.
• Intégration IA générative pour améliorer la productivité.
• Encadrement technique : code review, cadrage, montée en compétences juniors.

Track record :

- Refonte de la plateforme data Azure du Groupe Afflelou : -30 % de coûts cloud.
- Plateforme NLP multi-langues chez Danone : 50 000 verbatims RH par mois sur 15+ langues.
- Modernisation des flux comptables critiques chez AXA : -20 % de temps de traitement.
- Stack AI Coding chez STIME : skills Claude Code et prompts pour accélérer l'onboarding et le delivery data.

Stack : Databricks, PySpark, Apache Spark, Delta Lake, Unity Catalog, Lakehouse, Médaillon, Python, SQL. Azure (ADF, Synapse, ADLS Gen2, Event Hubs, Stream Analytics, Key Vault, Azure DevOps, Azure OpenAI). AWS (S3, EMR, Glue, Lambda, Step Functions, Athena). Apache Kafka, Airflow, Stonebranch, GitHub Actions, Docker. MLflow, scikit-learn, TensorFlow, Hugging Face, NLP, LLM. Power BI, DAX. Agile, Scrum, Tech Lead, FinOps.


Échangeons sur votre projet : contactez-moi directement via Malt.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

  • Espagnol

    Notions

Accepte de travailler sur site
Paris (jusqu’à 50 km), Lyon (jusqu’à 50 km), Bordeaux (jusqu’à 50 km), Marseille (jusqu’à 50 km), Nantes (jusqu’à 50 km)

Expériences

  • Stime DSI Groupement Les Mousquetaires
    Senior Azure Data Engineer
    GRANDE DISTRIBUTION
    septembre 2024 - février 2025 (5 mois)
    Châtillon, France
    La STIME est la filiale informatique du Groupement Les
    Mousquetaires (Intermarché, Bricomarché, Netto), avec plus de
    1 000 collaborateurs supportant 4 000+ points de vente en Europe.

    J'ai rejoint l'équipe Data Engineering pour le projet stratégique
    Da Vinci, avec deux objectifs : industrialiser la structuration
    des données pour les équipes métier, et mettre en place des KPI
    Power BI à destination des directeurs de point de vente.

    Au sein d'une équipe Agile de 10 personnes (3 PO, 1 Scrum Master,
    3 Data Analysts, 1 QA, 2 Data Engineers), je pilote l'architecture
    data Azure / Databricks et j'encadre les Data Engineers juniors.

    Responsabilités :

    • Conception et développement de pipelines ETL/ELT sur Azure Data
    Factory et Azure Databricks.
    • Architecture Lakehouse selon l'approche Médaillon
    (Bronze/Silver/Gold) avec Delta Lake.
    • Optimisation Spark avancée des workloads PySpark : partitioning,
    joins, skew, tuning mémoire, cache.
    • Mise en place de standards et bonnes pratiques de code PySpark.
    • Monitoring et support en production via Azure Log Analytics et
    Azure Monitor.
    • Code review et validation des pull requests sur Azure DevOps,
    encadrement technique des juniors.
    • Développement de skills Claude Code pour accélérer l'onboarding,
    le traitement des tickets JIRA et la documentation.

    Résultats :

    • -35 % de temps de traitement des pipelines grâce à
    l'optimisation Spark.
    • -30 % sur les coûts d'infrastructure Azure (FinOps).
    • Montée en compétences de l'équipe sur Databricks et PySpark.

    Stack : Azure Databricks, Databricks Notebooks, Delta Lake,
    Lakehouse, Médaillon, PySpark, Apache Spark, Spark SQL, Python,
    Azure Data Factory, ADLS Gen2, Azure Monitor, Azure Log Analytics,
    Azure SQL, Azure DevOps, CI/CD, FinOps, Power BI, ETL/ELT, Data
    Warehouse, Claude Code, AI Coding, JIRA, Confluence, Data Galaxy,
    Tech Lead, Code Review, Agile, Scrum.
    Azure Data Factory Azure Databricks SQL Server Cloud Azure Databricks
  • AXA France
    Senior Data Engineer
    BANQUE & ASSURANCES
    février 2024 - septembre 2024 (7 mois)
    Nanterre, France
    AXA France est un leader mondial de l'assurance avec plus de
    150 000 collaborateurs dans 50+ pays et plusieurs milliards
    d'euros de chiffre d'affaires.

    J'ai intégré la guilde Data (40+ ingénieurs) sur un projet
    stratégique de modernisation des flux de données comptables
    critiques et de fiabilisation du reporting financier à grande
    volumétrie. Collaboration étroite avec les équipes Finance et IT
    sur l'écosystème Azure et Apache Spark.

    Responsabilités :

    • Utilisation et optimisation de Carbon (framework propriétaire
    AXA basé sur Apache Spark) pour l'ingestion et la transformation
    des données comptables.
    • Conception et implémentation de pipelines ETL/ELT sur Azure Data
    Factory et Azure Databricks.
    • Architecture Lakehouse selon l'approche Médaillon
    (Bronze/Silver/Gold) avec Delta Lake sur ADLS Gen2, implémentée
    via Carbon.
    • Implémentation de workflows event-driven entre Apache Kafka,
    Azure Event Hubs et Databricks.
    • Optimisation Spark avancée : réduction mémoire, parallélisation,
    partitioning, joins.
    • Automatisation des déploiements via Azure DevOps (CI/CD).
    • Monitoring des pipelines en production via Azure Monitor.
    • Standardisation des pratiques de développement Spark au sein de
    la guilde Data.
    • Formation des équipes comptables sur les nouvelles sources de
    données.

    Résultats :

    • -20 % de temps de traitement des données financières.
    • -35 % sur les coûts d'infrastructure grâce à l'optimisation
    Spark (FinOps).
    • Standardisation des pratiques Spark adoptée par l'ensemble de
    la guilde Data.

    Stack : Azure Databricks, PySpark, Apache Spark, Spark SQL,
    Carbon, Delta Lake, Lakehouse, Médaillon (Bronze/Silver/Gold),
    Python, SQL, Azure Data Factory, ADLS Gen2, Azure Event Hubs,
    Apache Kafka, Azure Monitor, Azure DevOps, CI/CD, FinOps,
    ETL/ELT, Data Warehouse, Confluence.
    Azure Databricks PySpark Azure Data Factory Cloud Azure Azure Data Lake
  • GROUPE AFFLELOU
    ⚡ Tech Lead Data Engineer
    COMMERCE DE DÉTAIL
    octobre 2022 - février 2024 (1 an et 4 mois)
    Paris, France
    Le Groupe Afflelou est un leader européen de l'optique avec plus
    de 1 500 points de vente dans 8 pays et plus d'1 Md€ de chiffre
    d'affaires.

    J'ai rejoint le département IT comme Lead Data Engineer pour
    piloter la transformation digitale du groupe : modernisation de
    l'architecture data, optimisation des coûts cloud et
    internationalisation de la plateforme. Organisation multi-équipes
    (plateforme data centrale et feature teams analytiques métier).

    Responsabilités :

    • Refonte de la plateforme data sur Azure : architecture Data Lake
    standardisée (ADLS Gen2) pour l'ensemble du groupe.
    • Architecture Lakehouse Delta Lake selon l'approche Médaillon
    (Bronze/Silver/Gold).
    • Pipelines ETL/ELT avec Azure Data Factory et Azure Databricks.
    • Optimisation Spark avancée (PySpark) : partitioning, joins,
    cache, tuning clusters.
    • Ingestion end-to-end Google Analytics + flux de 1 500+ points
    de vente (10+ GB/jour).
    • Pilotage FinOps : analyse des workloads, redesign clusters,
    optimisation des coûts cloud.
    • Monitoring multi-environnements (PRD / PPD / DEV / SBX).
    • CI/CD complète via Azure DevOps et Databricks Repos.
    • Provisionnement Azure pour le marché espagnol, accès via Active
    Directory.
    • Développement d'APIs via Azure Functions et Azure API Management.
    • Animation de l'équipe Data Engineering, coaching sur Databricks
    et Azure.

    Résultats :

    • -30 % de coûts d'infrastructure cloud (FinOps).
    • -30 % de temps de traitement des pipelines.
    • -70 % de délais de déploiement (CI/CD).
    • +10 GB/jour ingérés et centralisés (1 500+ points de vente).
    • Autonomisation des équipes analytiques métier.
    • Déploiement international réussi sur le marché espagnol.

    Stack : Azure Databricks, Delta Lake, Lakehouse, Médaillon
    (Bronze/Silver/Gold), PySpark, Apache Spark, Spark SQL, Python,
    SQL, Azure Data Factory, ADLS Gen2, Azure Synapse Analytics,
    Azure Functions, Azure API Management, Azure DevOps, Active
    Directory, CI/CD, FinOps, Power BI, ETL/ELT, Tech Lead, Code
    Review.
    Databricks Azure DevOps SQL Azure Databricks Optimisation

Avis

5,0

sur 2 évaluations

Aucun détail d’avis à afficher

Ange a choisi de conserver les avis qui lui ont été laissés confidentiels.

Recommandations

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Diplôme d'Ingénieur
    ENSSAT - École Nationale Supérieure des Sciences Appliquées et de Technologie
    2017
    Diplôme d'Ingénieur, Institut Mines-Télécom — ENSSAT Lannion. Spécialisation : Systèmes Numériques et Machine Learning. Formation en traitement du signal, programmation, statistiques, IA, électronique embarquée.
  • Classes préparatoires PTSI/PT
    Saint Aubin La Salle
    2014
    Mathématiques, Sciences Physiques, Sciences Industrielles

Certifications

Compétences

Catégories