You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Souleymane SowSS

Souleymane Sow

Data Engineer | Python | PySpark| SQL| Docker| DBT

460 €/jour
1 projet
Ermont, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Souleymane

Ingénieur Généraliste spécialisé en Data Engineer/Science et titulaire d'un Master 1 en Mathématiques Fondamentales, je me positionne comme un expert de l'industrialisation des systèmes Data et IA. Ma passion est de transformer des problèmes complexes en solutions robustes, performantes et exploitables en production.

Je suis Freelance/Consultant, disponible pour des missions stratégiques autour de la modernisation de la Data Stack, du MLOps, de l'Analytics Engineering et de l'intégration de l'IA Générative.

J’ai participé à plusieurs projets significatifs :

Axio Conseils : pipeline de prédiction de sinistres auto, intégration via Streamlit, déploiement Docker et CI/CD.

EHDI Technologies : détection de fraude bancaire, intégration via API Flask et gestion PostgreSQL.

Generali France : optimisation de pipelines ETL et automatisation d’extractions de contrats pour l’équipe Data & Actuariat.

Je me suis récemment certifié sur dbt, renforçant mon expertise en modélisation et transformation de données. J’ai également développé un LLM Vanna SQL pour l’interprétation de requêtes et publié un tutoriel complet sur dbt. Mon portfolio illustre mes réalisations en PySpark, CI/CD et automatisation.

Compétences clés :

Data Engineering : ETL, Spark, AWS(bases), dbt, CI/CD avec GitHub Actions.

Automation & QA : pre-commit, Makefile, pytest, pyproject.toml, pre-config.yml..

Bases de données : SQL, BigQuery, Oracle, MySQL, PostgreSQL.

Machine Learning : régression, classification, prédiction.

Langages : Python, R, PySpark.

Backend & API : Flask REST-API, Streamlit

IA Générative : LLM avec Vanna SQL

Visualisation : Streamlit, Plotly, dashboards interactifs.

Ce que je propose :

Analyse et valorisation de vos données.

Mise en place de pipelines reproductibles et auditables.

Développement de modèles ML adaptés à vos besoins métiers.

Automatisation et documentation exhaustive pour garantir qualité et fiabilité.
  • Français

    Capacité professionnelle complète

  • Anglais

    Capacité professionnelle limitée

  • Wolof

    Bilingue ou natif

Accepte de travailler sur site
Ermont (jusqu’à 50 km), Paris (jusqu’à 50 km), Paris 10e Arrondissement (jusqu’à 50 km)

Expériences

  • Banque de Dakar
    Data Engineer Confirmé
    BANQUE & ASSURANCES
    avril 2022 - février 2026 (3 ans et 10 mois)
    Conception et maintien de pipelines PySpark/SQL (ingestion → transformation → tables exploitables) pour usages BI/analytics.
    • Optimisation des traitements (réduction temps de run, gestion volumétrie) : filtres, partitionnement, tuning Spark.
    • Data quality : contrôles (complétude, cohérence), jeux de tests automatisés, traçabilité et standardisation des jobs.
    • Collaboration équipes BI/IT : clarification besoins, adaptation des modèles, livraison itérative.

    Stack : Python, PySpark, SQL, PostgreSQL/Oracle, Hadoop (HDFS), Docker, Git, CI/CD, pytest
    PySpark Python SQL PostgreSQL Hadoop
  • AxioConseils
    Data Engineer / ML Engineer
    AGENCE & SSII
    mars 2021 - avril 2022 (1 an et 1 mois)
    Paris, France
    Conception et réalisation d'un POC visant à anticiper et prédire les risques de sinistres automobiles
    • La mise en place des processus permettant de bien démarrer le projet
    • Prétraitement des données et développement de modèles de prédiction de sinistres (LightGBM), atteignant un F1-score de 0.9
    • Containerisation avec Docker et déploiement d'API via Streamlit + PostgreSQL
    Environnement : Python, Pandas, Scikit-learn, Streamlit, Docker, PostgreSQL,
    Git, Makefile, pre-commit
    Scikit-learn Streamlit Docker PostgreSQL Pandas
  • eHDI Technologies
    Data Engineer
    AGENCE & SSII
    janvier 2020 - février 2021 (1 an et 1 mois)
    Paris, France
    • Cartographie des sources de données et des flux pour un énergéticien européen
    • Analyse de la qualité des données (complétude, cohérence, doublons) et définition de KPIs de data quality.
    • Élaboration d’une feuille de route d’amélioration alignée avec la trajectoire cible data & analytics (architecture, gouvernance).
    Environnement : Python , Pandas, PostgreSQL/Oracle, Git
    PostgreSQL Git Pandas Oracle

Avis

5,0

sur 1 évaluation

F

Frank

AXIO CONSEILS

Avis laissé le 10/10/2021

Recommandations

Soyez le premier à recommander Souleymane

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Inégnieur Généraliste spécalisé en système d'informations - Parcours Data Science
    IMT- ATLANTIQUE
    2019
    Le filière data science forme les futurs ingénieurs de l'IA sur les concepts et techniques indipensables pour bien mener un projet en data. J'avait le choix de 5 formations qui sont: - Machine Learning et Statistiques( Principes et Fondamentaux des algos, Méthode d'optimisation, tests d'hypothéses, etc...) - Business Intelligence (TALEND, TABLEAU) - Data Mining (EDA python, CRISP-DM) - Computer Vision avec Open-CV ( Tracking objects, Etude avané de l'image) - Deep Learning (MLP, Carte de koenan)

Certifications

Compétences

Catégories