Description

Data Engineer avec plus de 6 ans d’expérience, j’ai participé à de nombreux projets qui m’ont permis de bâtir une solide expertise dans l’univers du Big Data.

Je vous accompagne dans la conception et le développement de pipelines de données robustes, couvrant l’ensemble du cycle de vie : de l’ingestion, au nettoyage, à la transformation, à la modélisation, jusqu’à l’exposition des données pour des usages analytiques ou opérationnels.

Domaines d’expertise

Langues

Français
Bilingue ou natif

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

DOCAPOSTE
Senior Data Engineer
AGENCE & SSII
février 2025 - juin 2025 (4 mois)
Neuilly-sur-Seine, France
Benchmarking des Data Platforms (Databricks, Snowflake)
Objectif : Réalisation d'une étude comparative approfondie des principales plateformes de données du marché, basée sur des critères de performance, de coûts et de fonctionnalités.

Définition et validation des critères d’évaluations pour le benchmark
Sélection d’un jeu de données volumineux et représentatif des cas d’usage métiers (jointures complexes, filtrage, agrégations)
Conception et implémentation de scénarios de test reproductibles pour chaque plateforme :
ingestion, transformation (ELT), agrégation, requêtage analytique, montée en charge.
Rédaction d’un rapport comparatif détaillé incluant tableaux de synthèse, graphiques
Environnement: Azure Databricks, Snowflake, Azure DevOps (Repos,Pipeline), ADLS, Azure Data Factory, SQL, Spark, Python
Snowflake Databricks Azure DevOps SQL Spark
Intermarché
Senior Data Engineer
AGROALIMENTAIRE
mars 2024 - janvier 2025 (10 mois)
Châtillon, France
Migration de Teradata vers Azure Databricks - SIC Intermarché France
Développement de pipelines d’ingestion déclenchés à la dépose de fichiers par les applications sources dans le DataHub (Blob Storage), en s’appuyant sur un framework d’alimentation conçu avec Databricks et orchestré via Azure Data Factory
Rédaction de contrats d’interface définissant les spécifications techniques et les engagements mutuels pour les échanges de données entre les sources et le DataHub
Création des DDL des tables métiers sur Databricks en fonction des DDL existants sur Teradata
Migration des tables métiers de Teradata vers Databricks pour les besoins de reporting (tickets de caisse, chiffre d’affaires, clients, porteurs de carte, points de vente Intermarché France)
Développement et alimentation des tables calculées sur Databricks, en s’appuyant sur les scripts d’alimentation de Teradata
Orchestration des notebooks Databricks via Azure Data Factory
Environnement: Azure Databricks, Azure DevOps (Repos,Pipeline), ADLS, Azure Data Factory, SQL, Spark, Python
Databricks Spark SQL Python Microsoft Azure Azure Data Factory
LA POSTE
Data engineer
BANQUE & ASSURANCES
février 2023 - février 2024 (1 an)
Issy-les-Moulineaux, France
Projet 1 : Migration de Digicompta (Cloudera on premise vers Databricks)
Création des ressources : keyvaults, workspace Databricks premium, ADLS gen 2,
Mise à niveau du code de Spark 2 vers Spark 3 pour garantir la compatibilité avec Databricks Runtime
Migration des DAG Airflow vers Azure Data Factory pour orchestrer nos pipelines de jobs, remplaçant ainsi l'utilisation d'Airflow
Mise en œuvre d’une stratégie de tests post-migration :
Comparaison des résultats entre les environnements source (Cloudera) et cible (Databricks) sur des échantillons représentatifs.
Validation des volumes, des règles métier et des agrégats
Création de rapports de non-régression et analyse des écarts.
Projet 2 : C3S (élaboration d'indicateurs pour évaluer l'efficacité du système d'appel par les facteurs dans la livraison des courriers signés ou taxés)
Développement d’un pipeline d’ingestion sur Databricks pour le traitement quotidien de fichiers plats déposés dans un compte de stockage
Mise en œuvre d’une architecture en médaillon (Bronze / Silver / Gold) :
Bronze : Pour l’ingestion des fichiers bruts en l’état dans Delta Lake pour archivage et traçabilité.
Silver : Pour le traitement, nettoyage et normalisation des données.
Gold : calcul des indicateurs de performance (taux de livraisons signées, taux d’échec, temps moyen de réponse), agrégation par zone géographique et période.
Développement de jobs PySpark modulaires pour chaque couche
Optimisation du stockage (partitionnement , compaction, Z-Ordering) pour accélérer les requêtes en aval.

Environnement: Azure Databricks , Azure DevOps, Spark , ADLS Gen2, Azure Data Factory, SQL ,Python
Spark Azure Databricks Azure DevOps Azure Data Factory Azure Data Lake Storage

Consulter toutes les expériences de Ibrahima Matar

Soyez le premier à recommander Ibrahima Matar

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master Statistiques des nouvelles données
Université Paris Est Marne la Vallée
2017
Licence de Mathématiques et Informatique
Université Paris Est Marne la Vallée
2015

Databricks Certified Data Engineer Professional
Databricks
https://credentials.databricks.com/35b722df-039d-43d8-9afe-3579020f7830#acc.FtvTOKN6
Data Pipelines Lakehouse production Alerting Delta Lake Deployment Modélisation des données Spark ETL Testing
Databricks Certified Data Engineer Associate
Databricks
https://credentials.databricks.com/aef46aac-8ac7-4bd9-a6ec-e20833c1e4af#acc.AVsaGwBg
Python 3 Data Pipelines Lakehouse Delta Lake Databricks ETL Delta Live Tables Apache Spark SQL

Data Engineer

Ingénieur IA

Ibrahima Matar Gueye

Cloud Data Engineer

À propos de Ibrahima Matar

Expériences

Benchmarking des Data Platforms (Databricks, Snowflake)

Migration de Teradata vers Azure Databricks - SIC Intermarché France

Projet 1 : Migration de Digicompta (Cloudera on premise vers Databricks)

Projet 2 : C3S (élaboration d'indicateurs pour évaluer l'efficacité du système d'appel par les facteurs dans la livraison des courriers signés ou taxés)

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories