À propos de Ariane
Français
Bilingue ou natif
Italien
Capacité professionnelle limitée
Anglais
Capacité professionnelle limitée
Expériences
- OrangeBig data EngineerTÉLÉCOMMUNICATIONSjanvier 2022 - juillet 2025 (3 ans et 6 mois)Orange, Guyancourt, FranceOutils: Scala, SPARK, HIVE, Sqoop, SBT, Kafka, HBASE, SHELL, GitLab, JIRA, Jenkins, Docker, AWS (S3, EMR, Glue, Redshift), DBT.Manipulation et Gestion de données de télécomunications dans des environnements Hadoop Cloudera et AWS: données clients, entreprises, appels, géolocalisation et autres.○ Migrations des applications et des données vers des environnements Cloud AWS (S3, EMR), en garantissant l'isolation et la conformité entre environnements.○ Implémentation des drivers d'ingestion et de mise à disposition des données du datalake: en streaming et bash et parfois des expositions de données via des micro services.○ Traitements de normalisation (parsing JSON, enrichissement métier, mapping codes réseaux. . . ).○ Vérification automatique des volumes attendus et du contenu des champs critiques (nulls, doublons, formatage) avec des scripts scala et shell.○ Intégration des jobs dans Oozie avec XML + script Shell pour le déclenchement.○ Supervision quotidienne des jobs via logs sur YARN et traitement des alertes (latence, erreurs Kafka, batchs échoués).○ Packaging des jobs via SBT et Docker, gestion des dépendances, configuration via fichiers .conf par environnement (dev, qualif, prod).○ Rédaction de README techniques pour chaque pipeline et mise à jour du wiki interne.○ Mise en place de pipelines d'ingestion et d'exposition des données du Data Lake via Spark et Docker, avec déploiement automatisé CI/CD sur Jenkins.○ Profiling par appétence web.○ Text cleaning Engine.
- BNP AMData Scientist/ Quantitative AnalystBANQUE & ASSURANCESfévrier 2021 - janvier 2022 (11 mois)Paris, FranceOutils: Power BI, Python, Flask, Hadoop. Manipulation et diffusion des données ESG (Sustainalytics, Bloomberg, CDP, Trucost, ...)○ Conception et développement des outils permetant d'ingérer et d'interroger des données liées à l'ESG (merge des données ESG provenant de plusieurs sources).○ Amélioration d'un modèle de données de notation ESG spécifique pour un fond thématique.○ Participation à l'architecture et l'implémentation d'un module de mapping de données providers.○ création d'une interface utilisateur pour la visualisation des scores et indicateurs ESG.
- Crédit Agricole CIBDéveloppeur Java Big DataBANQUE & ASSURANCESjanvier 2019 - janvier 2021 (2 ans)Paris, FranceOutils: Spark, Jenkins, Hadoop, Java, hdfs, KAFKA, Hive, Shell, JPA, Springboot, web service REST/JSON, Pyspark, Zeppelin, maven.Manipulation des données de risque de marché notamment, référentiels, les métriques ... dans un environnement Hadoop Hortonworks○ Proposition d'une architecture d'un feeder de données.○ Ingestion des données dans le data Lake, construit sur un cluster Hadoop Hortonworks.○ mise en place de stratégies de tests.○ mise à disposition des données du data lake via des microservices, des tables Hive, des fichiers .orc.
Recommandations
Soyez le premier à recommander Ariane
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Mastère Spécialisé Big DataTélécom ParisTech2019Machine Learning, Deep Learning, IA
- Master en MathématiquesUniversité de Padova - Scuola Galileiana degli Studi Superiori-SGSS2017Mathématiques, optimisation, statistiques