You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Marwan HamzaouiMH

Marwan Hamzaoui

Data Engineer | ETL, Python, SQL, Automatisation

300 €/jour
Paris, FR
0-2 ans

Délai de réponse moyen : 1h

À propos de Marwan

Data Engineer, j'aide les équipes et les PME à fiabiliser et automatiser leurs flux de données : collecte, nettoyage, transformation et mise à disposition de données exploitables pour l'analyse et le reporting.

Concrètement, je conçois des pipelines ETL en Python et SQL, j'automatise les tâches répétitives (extraction d'API, traitement de fichiers, alimentation de bases) et je structure vos données pour qu'elles soient propres et exploitables. Je travaille au quotidien avec Python, SQL, Spark et Docker dans un contexte data réel, de l'ingestion de données externes jusqu'à la modélisation.

Ce qui me différencie : un code propre, documenté et que vous pouvez reprendre, une vraie rigueur sur la qualité des données, et une communication claire, j'explique chaque choix technique plutôt que de livrer une boîte noire.

Types de missions sur lesquelles j'interviens : création ou refonte de pipelines ETL, automatisation de traitements de données, scripts d'extraction et d'intégration, nettoyage et préparation de jeux de données, premiers traitements distribués avec Spark.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • CNP Assurances
    Data Engineer / Data Scientist
    BANKING AND INSURANCE
    septembre 2025 - Aujourd'hui (10 mois)
    Issy-les-Moulineaux, France
    Data Engineer & Data Scientist au sein de CNP Assurances. Je conçois des pipelines de données from scratch sur des projets à fort volume, au service de modélisations actuarielles avancées.

    🔹 Data Engineering :
    - Construction from scratch d'un pipeline d'extraction de données climatiques massives (API Copernicus, ERA5, CMIP6) : ingestion, traitement de fichiers NetCDF, agrégation spatiotemporelle sur la France et l'Allemagne (Python, PySpark, SQL)
    - Génération de données synthétiques pour exploiter des données assurantielles confidentielles : benchmark de 7 méthodes (SDV/GaussianCopula, CTGAN, TVAE, TabDDPM, PrivBayes…)

    🔹 Data Science appliquée (ce que mes pipelines alimentent) :
    - Modélisation GLM Binomial Négatif de la surmortalité estivale (Heat Index), comparaison XGBoost/Random Forest, projections actuarielles à horizon 2100 (5 modèles climatiques, 3 scénarios SSP)
    - Analyse exploratoire de données contrats et assurés, modèle de risques concurrents mortalité/rachat (Random Survival Forest)

    Environnement exigeant : données sensibles, rigueur et traçabilité.

    En parallèle : Master 2 Data Science/ Data Engineer, Université Paris 1 Panthéon-Sorbonne (Spark, architectures de données, Docker, CI/CD).
    Python SQL ETL Machine learning Git

Recommandations

Soyez le premier à recommander Marwan

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Catégories