You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Ibrahima Matar GueyeIM

Ibrahima Matar Gueye

Cloud Data Engineer

600 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Ibrahima Matar

Data Engineer avec plus de 6 ans d’expérience, j’ai participé à de nombreux projets qui m’ont permis de bâtir une solide expertise dans l’univers du Big Data.

Je vous accompagne dans la conception et le développement de pipelines de données robustes, couvrant l’ensemble du cycle de vie : de l’ingestion, au nettoyage, à la transformation, à la modélisation, jusqu’à l’exposition des données pour des usages analytiques ou opérationnels.

  • Français

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • DOCAPOSTE
    Senior Data Engineer
    AGENCE & SSII
    février 2025 - juin 2025 (4 mois)
    Neuilly-sur-Seine, France

    Benchmarking des Data Platforms (Databricks, Snowflake)

    Objectif : Réalisation d'une étude comparative approfondie des principales plateformes de données du marché, basée sur des critères de performance, de coûts et de fonctionnalités.

    • Définition et validation des critères d’évaluations pour le benchmark
    • Sélection d’un jeu de données volumineux et représentatif des cas d’usage métiers (jointures complexes, filtrage, agrégations)
    • Conception et implémentation de scénarios de test reproductibles pour chaque plateforme :
    • ingestion, transformation (ELT), agrégation, requêtage analytique, montée en charge.
    • Rédaction d’un rapport comparatif détaillé incluant tableaux de synthèse, graphiques
    Environnement: Azure Databricks, Snowflake, Azure DevOps (Repos,Pipeline), ADLS, Azure Data Factory, SQL, Spark, Python
    Snowflake Databricks Azure DevOps SQL Spark
  • Intermarché
    Senior Data Engineer
    AGROALIMENTAIRE
    mars 2024 - janvier 2025 (10 mois)
    Châtillon, France

    Migration de Teradata vers Azure Databricks - SIC Intermarché France

    • Développement de pipelines d’ingestion déclenchés à la dépose de fichiers par les applications sources dans le DataHub (Blob Storage), en s’appuyant sur un framework d’alimentation conçu avec Databricks et orchestré via Azure Data Factory
    • Rédaction de contrats d’interface définissant les spécifications techniques et les engagements mutuels pour les échanges de données entre les sources et le DataHub
    • Création des DDL des tables métiers sur Databricks en fonction des DDL existants sur Teradata
    • Migration des tables métiers de Teradata vers Databricks pour les besoins de reporting (tickets de caisse, chiffre d’affaires, clients, porteurs de carte, points de vente Intermarché France)
    • Développement et alimentation des tables calculées sur Databricks, en s’appuyant sur les scripts d’alimentation de Teradata
    • Orchestration des notebooks Databricks via Azure Data Factory
    Environnement: Azure Databricks, Azure DevOps (Repos,Pipeline), ADLS, Azure Data Factory, SQL, Spark, Python
    Databricks Spark SQL Python Microsoft Azure Azure Data Factory
  • LA POSTE
    Data engineer
    BANQUE & ASSURANCES
    février 2023 - février 2024 (1 an)
    Issy-les-Moulineaux, France

    Projet 1 : Migration de Digicompta (Cloudera on premise vers Databricks)

    • Création des ressources : keyvaults, workspace Databricks premium, ADLS gen 2,
    • Mise à niveau du code de Spark 2 vers Spark 3 pour garantir la compatibilité avec Databricks Runtime
    • Migration des DAG Airflow vers Azure Data Factory pour orchestrer nos pipelines de jobs, remplaçant ainsi l'utilisation d'Airflow
    • Mise en œuvre d’une stratégie de tests post-migration :
    • Comparaison des résultats entre les environnements source (Cloudera) et cible (Databricks) sur des échantillons représentatifs.
    • Validation des volumes, des règles métier et des agrégats
    • Création de rapports de non-régression et analyse des écarts.

    Projet 2 : C3S (élaboration d'indicateurs pour évaluer l'efficacité du système d'appel par les facteurs dans la livraison des courriers signés ou taxés)

    • Développement d’un pipeline d’ingestion sur Databricks pour le traitement quotidien de fichiers plats déposés dans un compte de stockage
    • Mise en œuvre d’une architecture en médaillon (Bronze / Silver / Gold) :
    • Bronze : Pour l’ingestion des fichiers bruts en l’état dans Delta Lake pour archivage et traçabilité.
    • Silver : Pour le traitement, nettoyage et normalisation des données.
    • Gold : calcul des indicateurs de performance (taux de livraisons signées, taux d’échec, temps moyen de réponse), agrégation par zone géographique et période.
    • Développement de jobs PySpark modulaires pour chaque couche
    • Optimisation du stockage (partitionnement , compaction, Z-Ordering) pour accélérer les requêtes en aval.

    Environnement: Azure Databricks , Azure DevOps, Spark , ADLS Gen2, Azure Data Factory, SQL ,Python
    Spark Azure Databricks Azure DevOps Azure Data Factory Azure Data Lake Storage

Recommandations

Soyez le premier à recommander Ibrahima Matar

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master Statistiques des nouvelles données
    Université Paris Est Marne la Vallée
    2017
  • Licence de Mathématiques et Informatique
    Université Paris Est Marne la Vallée
    2015

Certifications

Compétences

Catégories