Description

J’accompagne les organisations dans la refonte et l’alignement de leurs architectures Data & IA.

Mon approche est systémique : diagnostic des flux, restauration de la cohérence technique, et alignement des équipes Data/Cloud.

Spécialisée GCP (BigQuery, Airflow, Dataflow, Cloud Run), j’interviens sur des missions de redressement, migration, gouvernance et excellence technique.

Références : Renault Digital, Fnac Darty, BPCE, Natixis.

Disponible pour missions senior / architecture / conseil stratégique.

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

Renault Digital
Senior Data Engineer / Architecte GenAI
mai 2025 - novembre 2025 (6 mois)
• Diagnostic et refonte d’une plateforme interne GenAI (upload → parsing → embeddings → recherche).
• Stabilisation de la chaîne d’ingestion MongoDB Atlas (rebuild d’index textuels et vectoriels, contrôle de cohérence).
• Conception d’une architecture cible GCP : Cloud Run + Dataflow + Airflow pour découpler les traitements.
• Documentation exécutable et transfert de connaissances aux équipes Data & Cloud.
Stack : Python, GCP (Cloud Run, Dataflow, BigQuery, Airflow), MongoDB, GitLab CI/CD, RAG, OpenAPI, GKE.
MongoDB Google Cloud Platform (GCP) Google Kubernetes Engine (GKE) Cloud run Gitlab
Fnac Darty
Data engineer GCP
août 2023 - décembre 2024 (1 an et 4 mois)
Migration des scripts Bash (crontab sur VM) vers Airflow, pour fiabiliser et industrialiser les traitements
Refactorisation du code (documentation, factorisation, upgrade Python) et mise en place d’une CI/CD via GitLab & Terraform
Optimisation de dashboards Looker Studio (clustering, splitting BigQuery) pour réduire les coûts
Automatisation de la modération des avis clients avec un modèle LLM (Text-Bison) déployé via Cloud Function
Google Cloud Platform (GCP) Airflow Python Terraform LLMs Cloud Function Google Cloud Run Bash BigQuery Docker Méthode agile
BPCE Infogérance & Technologies
Data Engineer & Tech Lead Streaming Factory
décembre 2017 - avril 2023 (5 ans et 4 mois)
Rôles successifs :

1. Création & Gestion de la Streaming Factory (2021 – 2023)

Développement de pipelines temps réel & standardisation des bonnes pratiques
Mise en production d’architectures distribuées (Kafka, NiFi)
Recrutement et montée en compétence des Data Engineers sur le streaming
Stack : Kafka, NiFi, Solr, Hive, GCP, Java, Python

2. Data Engineer / Tech Lead – BPCE Référentiels, Financement & Trade (2021 – 2022)

Accompagnement des équipes métiers sur Hadoop, de la conception à la mise en œuvre
Scripts PySpark pour analyser des fichiers XML et stocker les données dans Hive
Développement et optimisation des flux d’alimentation du Datalake Référentiels
Stack : CDP, Hive, Spark, Kafka (Python lib), PySpark, CI/CD (XLDeploy, Jenkins)
3. Industrialisation & Best Practices – BPCE Assurance Vie (2019 – 2020)

Industrialisation des modèles data science (score d’octroi)
Mise en place de templates réutilisables (versioning, logging, packaging)
Collaboration aux guidelines Groupe pour l’industrialisation des modèles
Stack : Python, PySpark, Jupyter, Git, Cookie Cutter
4. Data Engineer – Trade & Treasury (2019 – 2020)

Transfert de données vers HDFS et mise en prod d’algorithmes de fraude (scoring, profilage)
Stack : HDP, Hive, Python, PySpark, Git, CI/CD
5. Data Engineer – Full Trade Monitoring (2018 – 2019)

Mise en place d’un Datalake (Kafka, Hive, Solr, PySpark) et d’un moteur de recherche Flask
Collaboration étroite avec Data Science & métiers
HDP CDP Hadoop Spark Scala Apache Kafka Apache Nifi Atlas Python Bash Hive Solr Jenkins XLDeploy Control-M XLRelease PySpark

Consulter toutes les expériences de Sarra

Soyez le premier à recommander Sarra

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master en Big Data et Machine Learning
Université Paris 8
2017
- Cours connexes : Intelligence artificielle, plateformes Big Data, sécurité informatique, algorithmes avancés} - Réalisation d'un mémoire portant sur la prédiction de la maladie de Parkinson à l'aide de données provenant de smartphones (Data Set Kaggle), SVM, WEKA, Python, (publications ACM)
Licence,
Université Paris 8
2015
Licence en Conception, Développement et Validation des Applications

Google Cloud Certified Professional Data Engineer
Google Cloud
2023
https://www.credly.com/badges/3a197366-af09-42a9-90f8-4effce5f603f/public_url

Data Engineer

Cloud Engineer & Architect

Sarra Msellek

Architecte Data & AI Strategy | GCP | Strat

À propos de Sarra

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories