À propos de Sarra
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- Renault DigitalSenior Data Engineer / Architecte GenAImai 2025 - novembre 2025 (6 mois)• Diagnostic et refonte d’une plateforme interne GenAI (upload → parsing → embeddings → recherche).• Stabilisation de la chaîne d’ingestion MongoDB Atlas (rebuild d’index textuels et vectoriels, contrôle de cohérence).• Conception d’une architecture cible GCP : Cloud Run + Dataflow + Airflow pour découpler les traitements.• Documentation exécutable et transfert de connaissances aux équipes Data & Cloud.Stack : Python, GCP (Cloud Run, Dataflow, BigQuery, Airflow), MongoDB, GitLab CI/CD, RAG, OpenAPI, GKE.
- Fnac DartyData engineer GCPaoût 2023 - décembre 2024 (1 an et 4 mois)
- Migration des scripts Bash (crontab sur VM) vers Airflow, pour fiabiliser et industrialiser les traitements
- Refactorisation du code (documentation, factorisation, upgrade Python) et mise en place d’une CI/CD via GitLab & Terraform
- Optimisation de dashboards Looker Studio (clustering, splitting BigQuery) pour réduire les coûts
- Automatisation de la modération des avis clients avec un modèle LLM (Text-Bison) déployé via Cloud Function
- BPCE Infogérance & TechnologiesData Engineer & Tech Lead Streaming Factorydécembre 2017 - avril 2023 (5 ans et 4 mois)
- Rôles successifs :
1. Création & Gestion de la Streaming Factory (2021 – 2023)Développement de pipelines temps réel & standardisation des bonnes pratiquesMise en production d’architectures distribuées (Kafka, NiFi)Recrutement et montée en compétence des Data Engineers sur le streamingStack : Kafka, NiFi, Solr, Hive, GCP, Java, Python2. Data Engineer / Tech Lead – BPCE Référentiels, Financement & Trade (2021 – 2022)Accompagnement des équipes métiers sur Hadoop, de la conception à la mise en œuvreScripts PySpark pour analyser des fichiers XML et stocker les données dans HiveDéveloppement et optimisation des flux d’alimentation du Datalake RéférentielsStack : CDP, Hive, Spark, Kafka (Python lib), PySpark, CI/CD (XLDeploy, Jenkins)3. Industrialisation & Best Practices – BPCE Assurance Vie (2019 – 2020)Industrialisation des modèles data science (score d’octroi)Mise en place de templates réutilisables (versioning, logging, packaging)Collaboration aux guidelines Groupe pour l’industrialisation des modèlesStack : Python, PySpark, Jupyter, Git, Cookie Cutter4. Data Engineer – Trade & Treasury (2019 – 2020)Transfert de données vers HDFS et mise en prod d’algorithmes de fraude (scoring, profilage)Stack : HDP, Hive, Python, PySpark, Git, CI/CD5. Data Engineer – Full Trade Monitoring (2018 – 2019)Mise en place d’un Datalake (Kafka, Hive, Solr, PySpark) et d’un moteur de recherche FlaskCollaboration étroite avec Data Science & métiers
Recommandations
Soyez le premier à recommander Sarra
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Master en Big Data et Machine LearningUniversité Paris 82017- Cours connexes : Intelligence artificielle, plateformes Big Data, sécurité informatique, algorithmes avancés} - Réalisation d'un mémoire portant sur la prédiction de la maladie de Parkinson à l'aide de données provenant de smartphones (Data Set Kaggle), SVM, WEKA, Python, (publications ACM)
- Licence,Université Paris 82015Licence en Conception, Développement et Validation des Applications
Certifications
- Google Cloud Certified Professional Data EngineerGoogle Cloud2023