You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Fayssal B.FB

Fayssal B.

Data Engineer · Databricks · Azure Lakehouse Spark

611 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Fayssal

Data Engineer spécialisé Databricks, Spark et Azure avec 5 ans d'expérience dans la construction de pipelines de données robustes et performants pour des environnements critiques.
Je conçois et industrialise des architectures Lakehouse (Bronze / Silver / Gold) sur Azure, avec une approche orientée performance, qualité de code et observabilité.
Ce que j'apporte à vos projets :
▸ Ingestion & pipelines — construction de pipelines ETL/ELT complexes (Databricks, Azure Data Factory, Airflow, dbt), ingestion multi-sources (API, SFTP, fichiers, streaming)
▸ Optimisation Spark — analyse de plans d'exécution, élimination des shuffles, partitionnement, Z-ordering. J'ai réduit un job critique de 6h à 1h chez Société Générale
▸ Architecture Data — modélisation Delta Lake, gouvernance Unity Catalog, orchestration de bout en bout
▸ Industrialisation — code modulaire et testable (Pytest, Cucumber), CI/CD (GitLab, Jenkins, Azure DevOps), migration Dev→Prod complète
Mes environnements : Apache Spark, PySpark, Scala, Python, SQL, Delta Lake, Databricks, Azure Data Lake Gen2, Snowflake, Airflow 2.x, ADF, dbt, Oracle, Hive
Secteurs : Banque (Société Générale) · Télécoms (Canal+) · Asset Management (Carmignac) · Énergie (Engie) · Paris sportifs (Betclic)
Certifications Databricks :
✦ Data Engineer Professional (2026)
✦ Data Engineer Associate (2024)
✦ Apache Spark 3.0 Developer (2024)
Diplômé ingénieur EPITA, spécialisation Intelligence Artificielle.
Je travaille en français et en anglais.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • CANAL+ TELECOM
    Data Engineer / Devops / Software Engineer / Archi
    février 2025 - Aujourd'hui (1 an et 4 mois)
    Architecture collecte SFTP et historisation des factures multi-opérateurs (OI & sous-traitants), corrélation multi-systèmes (Praxedo, Interop, refacturation OI), certification des anomalies de facturation. Oracle.
    Réalisations clés
    ▸ Industrialisation complète Airflow : conception et développement de DAGs de synchronisation SFTP avec préservation d'arborescence, gestion des exclusions, reprise sur erreur et logging structuré.
    ▸ Architecture d'ingestion modulaire : patern BaseProcessing (load_data / clean_data / insert_data) déployé sur 6+ flux (PXO, GUDI, MTHD, YANA/KOUROU, SRR).
    ▸ Migration Dev → Prod : packaging complet du projet (config, connexions, variables Airflow), mise en place de tests unitaires et validations de données.
    ▸ Création des tables Oracle (DDL) et schémas d'historisation.
    ▸ Orchestration de bout en bout : SFTP → serveur data → Oracle.
    Stack : Airflow 2.x, Python (Pandas), Oracle, Linux, Git/GitLab
  • SOCIÉTÉ GÉNÉRALE
    Data Engineer
    octobre 2023 - novembre 2024 (1 an et 1 mois)
    Pipeline de cartographie de flux firewall en quasi-réel (1,3 Cloud LUCID, Hive.
    Réalisations clés
    ▸ Optimisation Spark majeure : réduction du temps d'exécution d'un job critique de 6 heures à 1 heure (÷6) par analyse du plan d'exécution, repartitionnement et élimination des shuffles.
    ▸ Pipeline d'enrichissement : collecte API partenaires, alimentation quotidienne des référentiels Hive, jointures multi sources pour la cartographie des logs bruts.
    ▸ Tooling d'observabilité : fonction utilitaire de diagnostic des partitions (volume par partition) pour accélérer le debugging en production.
    ▸ Transformation JSON → Hive via jobs Spark, orchestrés quotidiennement par Control-M.
    ▸ Monitoring de la progression des jobs via Yarn.
    Stack : Control-M, Yarn, Hive, Jenkins, Scala, Spark, HQL, GitHub
  • CARMIGNAC
    Data Engineer
    mars 2022 - octobre 2023 (1 an et 7 mois)
    ▸ Librairie Scala/Spark mutualisée : co-développement d'une librairie via IntelliJ pour génériser les traitements redondants, partagée dans l'écosystème Databricks.
    ▸ Pipeline event-driven ADF : déclenchement automatique sur dépôt de fichiers Excel, parsing multi-onglets, validation de schéma par job Spark (routing bad/valid), enrichissement métadonnées et stockage en tables Delta.
    ▸ Jointure cross-source : croisement Morningstar (fonds d'investissement) et Vendome (actifs financiers), écriture PostgreSQL pour alimentation BI.
    ▸ Mise en place de tests Cucumber (BDD) pour validation des développements.
    ▸ Construction des pipelines ADF (Linked Services, Datasets, Triggers, Alerts).
    ▸ Mise en production du stream BI Digitalization.
    Stack : Azure Data Factory, Blob Storage, Databricks, Cucumber, Scala, Spark, SQL, IntelliJ
    Refonte backend de l'application Agathe (maintenance prédictive IA) : migration vers FastAPI pour améliorer la maintenabilité et les performances. Capteurs IoT temps réel sur équipements industriels.

Recommandations

Soyez le premier à recommander Fayssal

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Diplôme d'ingénieur, Informatique
    EPITA: Ecole d'Ingénieur en Informatique
    2021
    Diplôme d'ingénieur, Informatique
  • Industrial Engineering,
    Chulalongkorn Univerisity
    Industrial Engineering,

Certifications

Compétences (20)

Catégories