You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Sarra MsellekSM

Sarra Msellek

Architecte Data & AI Strategy | GCP | Strat

750 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Sarra

J’accompagne les organisations dans la refonte et l’alignement de leurs architectures Data & IA.
Mon approche est systémique : diagnostic des flux, restauration de la cohérence technique, et alignement des équipes Data/Cloud.
Spécialisée GCP (BigQuery, Airflow, Dataflow, Cloud Run), j’interviens sur des missions de redressement, migration, gouvernance et excellence technique.
Références : Renault Digital, Fnac Darty, BPCE, Natixis.
Disponible pour missions senior / architecture / conseil stratégique.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Renault Digital
    Senior Data Engineer / Architecte GenAI
    mai 2025 - novembre 2025 (6 mois)
    • Diagnostic et refonte d’une plateforme interne GenAI (upload → parsing → embeddings → recherche).
    • Stabilisation de la chaîne d’ingestion MongoDB Atlas (rebuild d’index textuels et vectoriels, contrôle de cohérence).
    • Conception d’une architecture cible GCP : Cloud Run + Dataflow + Airflow pour découpler les traitements.
    • Documentation exécutable et transfert de connaissances aux équipes Data & Cloud.
    Stack : Python, GCP (Cloud Run, Dataflow, BigQuery, Airflow), MongoDB, GitLab CI/CD, RAG, OpenAPI, GKE.
    MongoDB Google Cloud Platform (GCP) Google Kubernetes Engine (GKE) Cloud run Gitlab
  • Fnac Darty
    Data engineer GCP
    août 2023 - décembre 2024 (1 an et 4 mois)
    • Migration des scripts Bash (crontab sur VM) vers Airflow, pour fiabiliser et industrialiser les traitements
    • Refactorisation du code (documentation, factorisation, upgrade Python) et mise en place d’une CI/CD via GitLab & Terraform
    • Optimisation de dashboards Looker Studio (clustering, splitting BigQuery) pour réduire les coûts
    • Automatisation de la modération des avis clients avec un modèle LLM (Text-Bison) déployé via Cloud Function
    Google Cloud Platform (GCP) Airflow Python Terraform LLMs Cloud Function Google Cloud Run Bash BigQuery Docker Méthode agile
  • BPCE Infogérance & Technologies
    Data Engineer & Tech Lead Streaming Factory
    décembre 2017 - avril 2023 (5 ans et 4 mois)
    • Rôles successifs :

    1. Création & Gestion de la Streaming Factory (2021 – 2023)

    Développement de pipelines temps réel & standardisation des bonnes pratiques
    Mise en production d’architectures distribuées (Kafka, NiFi)
    Recrutement et montée en compétence des Data Engineers sur le streaming
    Stack : Kafka, NiFi, Solr, Hive, GCP, Java, Python

    2. Data Engineer / Tech Lead – BPCE Référentiels, Financement & Trade (2021 – 2022)

    Accompagnement des équipes métiers sur Hadoop, de la conception à la mise en œuvre
    Scripts PySpark pour analyser des fichiers XML et stocker les données dans Hive
    Développement et optimisation des flux d’alimentation du Datalake Référentiels
    Stack : CDP, Hive, Spark, Kafka (Python lib), PySpark, CI/CD (XLDeploy, Jenkins)
    3. Industrialisation & Best Practices – BPCE Assurance Vie (2019 – 2020)

    Industrialisation des modèles data science (score d’octroi)
    Mise en place de templates réutilisables (versioning, logging, packaging)
    Collaboration aux guidelines Groupe pour l’industrialisation des modèles
    Stack : Python, PySpark, Jupyter, Git, Cookie Cutter
    4. Data Engineer – Trade & Treasury (2019 – 2020)

    Transfert de données vers HDFS et mise en prod d’algorithmes de fraude (scoring, profilage)
    Stack : HDP, Hive, Python, PySpark, Git, CI/CD
    5. Data Engineer – Full Trade Monitoring (2018 – 2019)

    Mise en place d’un Datalake (Kafka, Hive, Solr, PySpark) et d’un moteur de recherche Flask
    Collaboration étroite avec Data Science & métiers
    HDP CDP Hadoop Spark Scala Apache Kafka Apache Nifi Atlas Python Bash Hive Solr Jenkins XLDeploy Control-M XLRelease PySpark

Recommandations

Soyez le premier à recommander Sarra

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master en Big Data et Machine Learning
    Université Paris 8
    2017
    - Cours connexes : Intelligence artificielle, plateformes Big Data, sécurité informatique, algorithmes avancés} - Réalisation d'un mémoire portant sur la prédiction de la maladie de Parkinson à l'aide de données provenant de smartphones (Data Set Kaggle), SVM, WEKA, Python, (publications ACM)
  • Licence,
    Université Paris 8
    2015
    Licence en Conception, Développement et Validation des Applications

Certifications

Compétences

Catégories