You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Mouhammad DiakhateMD

Mouhammad Diakhate

Data Engineer|Développeur Full Stack|Cloud|DevOps

424 €/jour
Lyon, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Mouhammad

J'aide les entreprises et les particuliers dans la conception, mise en place et l'automatisation de leur Data Lake et de leurs Data Warehouses. Dans une démarche d'amélioration progressive, je propose une architecture et des stratégies de pipeline ETL adaptées aux besoins.

Conformément aux bonnes pratiques DevOps, je propose des solutions refactoring d'infratructure pour les entreprises et les particuliers souhaitant adopter une démarche Cloud Native orienté orchestration de conteneurs ainsi que la mise en place de pipelines CI-CD.

J'aide aussi à l'adoption et à la migration vers le Cloud avec des processus automatisés ainsi qu'à la migration de données et des workloads.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Lyon (jusqu’à 50 km)

Expériences

  • CMA CGM
    Data Engineer
    TRANSPORTS
    mai 2024 - septembre 2024 (5 mois)
    Lyon, France
    Contexte :
    • Equipe de 6 personnes
    • Projet de refonte du preprocessing
    • Méthodologie Scrum & Jira

    Objectif :
    • Refonte du preprocessing Legacy du projet Optisow
    • Création d’un module de lecture de fichiers au format EDI utilisé en transport maritime
    • Fournir un plan de refactoring
    Missions :
    • Etude des règles du shipping et de l’optimisation du chargement des porte-conteneurs de la CMA-CGM
    • Conception d’un data model permettant de structurer les données de BAPLIE (plan de baie) des fichiers au format EDI
    • Développement d’un module de parsing de fichiers EDI (shipping) + support sur les incidents en production
    • Refactoring des règles fonctionnelles qui a permis une réduction de plus de 66% du code
    • Ajout des bonnes pratiques de design pattern en documentation sur Confluence
    • Implémentation d’un algorithme de “restow” permettant d’optimiser le placement des conteneurs lourds en cale
    • Fourniture d’un plan de refactoring avec toutes les bonnes pratiques à suivre pour les futures développeurs
    • Séances de transfert de connaissance
  • ENGIE
    Data Engineer
    ENERGIE
    janvier 2023 - avril 2024 (1 an et 3 mois)
    Lyon, France
    Contexte :

    • Equipe de 6 personnes
    • Projet de migration
    • Méthodologie SAFe


    Objectif : Migration de la data plateforme legacy de ENGIE vers Databricks sur une architecture Lakehouse


    Missions :
    • Conception d’une nouvelle architecture hybride data vault + dimensionnelle
    • Reflexion sur les problématique d’historique et de gestion des contraintes d’intégrité
    • Réflexion sur l’uniformisation des données multi-source
    • Proposition d’une architecture de donnée hybride alliant data vault et schéma en étoile
    • Proposition d’une solution de gestion d’historique et de correction de l’historique
    • Proposition d’une architecture de pipeline et de structuration du code
    • Intégration de nouvelles couches “silver” (technical layer et business layer)
    • Conception et réalisation d’un nouveau MDD en architecture 3-hop sur un Lakehouse Databricks
    • Pipeline d’intégration de la bronze vers la silver layer
    • Construction d’une tech layer (silver) de fiabilisation de la donnée qui gère les contraintes
    • Versioning des données, reconstitution d’historique en SCD2
    • Ajout d’une couche de correction d’historique
    • Sur la partie fonctionnelle : Construction d’une business layer appliquant les règles fonctionelles
    • Gestion du scheduling des pipelines d’ingestion
    • Analyse des objets métier, déconstruction des règles de gestions appliqués dans les rapports
    • Migration des workloads SQL Server Legacy de la silver vers des tables “gold”
    • Analyse des workloads legacy
    • Reverse engineering du Data Warehouse Legacy pour en faire des scripts pyspark
    • Création de tables gold prêt à l’emploi pour les rapports Power-Bi et SSRS
    • Création d’un module de data lineage
    • Parcours en regex de toutes les procédures stockées sur SQL Server pour toutes les couches pour extraire le lineage de la donnée donnant une trace de la source de chaque table legacy
    • Création d’un couche d’information dans la tech layer permettant de tracking des tables
    Spark SQL Spark Delta Lake Azure Databricks Databricks Github Actions GitHub AWS S3 Programmation Python T-SQL SQL Server Microsoft Power BI
  • SNCF Voyageurs
    Data Engineer
    TRANSPORTS
    août 2022 - novembre 2022 (4 mois)
    Lyon, France
    Contexte : Equipe de 10 personnes dont 5 Data Engineer – projet de MCO

    Objectif : Accompagnement client pour le développement de nouveaux KPI pour le projet T-REX du Transilien

    Missions :

    • Refonte de l’environnement d’assemblage sur Kubernetes et Azure Kubernetes Services
    • Gestion du pipeline Azure Data Factory et des uses cases métier
    • Implémentation et déploiement des indicateurs sous forme conteneurs
    • Création des tasks Airflow
    • Orchestration de l'ingestion de données et des scheduler des pipelines Azure Data Factory
    • Monitoring et debug de l’exécution de pipelines
    • Migration du référentiel d'artefacts des pipelines de CD Jenkins Legacy de Nexus vers JFrog Artefactory
    Azure Data Factory Azure Databricks Azure Storage Azure SQL Database Microsoft Azure PySpark Programmation Python Spark Microsoft Power BI Artifactory Jenkins/Sonar Airflow Gitlab CI/CD Kubernetes

Recommandations

Soyez le premier à recommander Mouhammad

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Ingénieur de Conception en Génie Informatique et Télécommunications
    Ecole Polyechnique de Thiès
    2021
    Orchestration et Conteneurisation Microservices et Applications Cloud Native Cloud Computing, Virtualisation et Cloud avec AWS Développement Mobile Android Développement WEB Machine Learning Deep Learning Business Intelligence Réseaux et Télécoms Réseaux Mobiles Services Réseaux Services WEB Java Architecture des ordinateurs Analyse de données Architecture des ordinateurs Agilité et Gestion de projet SCRUM Traitement du signal Python avancé Base de données avancé Modélisation stochastique Statistique Inférenciel Linux et Administration Systèmes et Réseaux Merise et UML Oracle Complexité Algorithmique Langage C avancé Théorie des Graphes
  • Master en Datascience
    Université Claude Bernard Lyon 1
    DS1 - Graphes, Complexité, Combinatoire, 3 ECTS DS2 - Data Visualization, 3 ECTS DS3 – Big Data Analytics, 3 ECTS DS4 - Cloud Computing, 3 ECTS DS5 - Statistique Inférentielle, 3 ECTS DS6 - Modèles de Régression, 3 ECTS DS7 - Modèles Graphiques Probabilistes, 3 ECTS DS8 - Data Mining, 3 ECTS DS9 - Machine Learning, 3 ECTS DS10 - Fondamentaux Mathématiques pour les Data Science, 3 ECTS

Compétences

Catégories