À propos de Jaber
Arabe
Bilingue ou natif
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- Safran NacellesCloud Data EngineerAÉRONAUTIQUE & AÉROSPATIALEjuin 2024 - Aujourd'hui (2 ans)Le Havre, FranceInterlocuteurs : Différents métiers chez SNA• Développements Talend :• Ingestion des données SAP en mode RAW vers AWS S3• Ingestion en masse des tables de petite et moyenne taille avec le module icontrol• Ingestion de tables très volumineuses en batch• Data Engineering dans AWS• Création d’un package python permettant de cataloguer les tables SAP dans une database Glue sous formaticeberg, en intégrant le partitionnement, la mise à jour ou l’écrasement des tables selon les besoins.• Transformation des données Raw vers des données Curated et Product selon les besoins métiers, cataloguéesdans Glue, pour des fins de requêtage dans Athena ou reporting sur Power BI• Création d’un système d’industrialisation rapide de requêtes SQL développées par les métiers pour donnerplus d’autonomie aux métiers pour exploiter la donnée RAW en utilisant Lambda• Orchestration des différents flux de données en utilisant des Step Functions, puis en se basant sur architecureEvent Driven basée sur une base de données DynamoDB et EventBridge.• Projet Automac :• Projet de numérisation de la chaine de production nécessitant un rafraichissement de reportingtoutes les 15min• Développement des différentes briques techniques : Requêtes SQL, Lambdas, Orchestrarion.• Industrialisation via Terraform.Environnement technique : Python (3.9 & 3.12), Spark, Iceberg, SQL, AWS (S3, Glue, Lambda, Athena, EventBridge, StepFunction,DynamoDB), Gitlab, Gitlab CI, Terraform.
- Generali FranceData engineerBANQUE & ASSURANCESoctobre 2023 - Aujourd'hui (2 ans et 8 mois)Paris, FranceInterlocuteurs : Equipe valeur Client – Projet CVM (Client Value Management)Réalisations :• Développement Python:• Suite à l’achat de l’assurance « La Medicale » par Generali, le besoin était d’intégrer les valeurs des clientsGenerali au sein de l’application CVM (Client Value Management)• Enrichissement de CVM en temps réel• Développement de nouvelles fonctionnalités permettant de recevoir les flux Kafka de type la médicale et detraiter la donnée et la renvoyer• Développement des tests unitaires• Intégration des données la médicale dans MongoDB• Développement d’une Web App avec Streamlit permettant de faire un monitoring fonctionnel des donnéesCVM :• Interface de recherche permettant de trouver toutes les références d’un ID dans les basesSnowflake (Après les traitements en Batch) MongoDB (Après traitement en temps réel)• Pour un ID, un reporting sur la valeur du contrat ou du client• Une timeline permettant d’afficher toutes les références dans un ordre chronologique pourtracer les mouvements des valeurs client ou contrat• Data Engineering :• Développement de batchs de traitements de données avec PySpark pour intégrer les données de lamédicale dans les bases Hadoop de Generali• Evolution des batchs existants selon la demande de l’équipe client• Développement de DAGs sur Airflow pour permettre l’exécution des batchsEnvironnement technique : Python (3.7 & 3.10), Spark, Hadoop, SQL, Airflow, MongoDB, Streamlit, Snowflake, Snowpark, Jupyter,,Docker, Kubernetes, Rancher, Cloudera
- CleyropDéveloppeur Python & Data EngineerHIGH TECHjanvier 2023 - septembre 2023 (9 mois)Paris, FranceInterlocuteurs : CPO, PM, Gestionnaire de projets clientsRéalisations :• Produit :• Développement d’une librairie Python interne qui permet :• La lecture de datasets sous format Iceberg• La mise en disposition des datasets sous forme d’objet PySpark Pandas• Lister les datasets d’un projet• Abstraction de ces différentes opérations pour l’utilisateur pour optimiser l’UX• Développement de tests unitaires pour les fonctionnalités citées• CI/CD avec Giltab CI et la semantic release• Création d’une image Docker de Jupyterlab permettant de prendre en compte la librairiedéveloppée tout en ajoutant les services nécessaires pour la couche données, commeSpark, Iceberg et Nessie• Service (Client Atout France) :• Correction des bugs aux niveaux des pipelines existants, développés avec Python• Optimisation, amélioration et documentation de l’existant• Refonte des différentes fonctionnalités en utilisant l’API PySpark PandasEnvironnement technique : Python, Spark, Iceberg, Jupyter Notebook,Git, Gitlab CI/CD, Docker, Kubernete
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4