Description

De part mon cursus, je suis en mesure d’intervenir sur des problématiques de d'ingestion et de mise à disposition de données, migration de données, data Science, gestion de production, tarification (pricing), gestion de stock, recherche opérationnelle, optimisation de revenue et toute autre problématiques liées aux mathématiques appliquées ou à la statistique. Ceci dans des secteurs variés comme la banque, les télécoms et la finance durable, l'industrie ...

Langues

Français
Bilingue ou natif
Italien
Capacité professionnelle limitée
Anglais
Capacité professionnelle limitée

Préférences en matière de lieu de travail

Accepte de travailler sur site

Élancourt (jusqu’à 50 km)

Orange
Big data Engineer
TÉLÉCOMMUNICATIONS
janvier 2022 - juillet 2025 (3 ans et 6 mois)
Orange, Guyancourt, France
Outils: Scala, SPARK, HIVE, Sqoop, SBT, Kafka, HBASE, SHELL, GitLab, JIRA, Jenkins, Docker, AWS (S3, EMR, Glue, Redshift), DBT.

Manipulation et Gestion de données de télécomunications dans des environnements Hadoop Cloudera et AWS: données clients, entreprises, appels, géolocalisation et autres.

○ Migrations des applications et des données vers des environnements Cloud AWS (S3, EMR), en garantissant l'isolation et la conformité entre environnements.

○ Implémentation des drivers d'ingestion et de mise à disposition des données du datalake: en streaming et bash et parfois des expositions de données via des micro services.

○ Traitements de normalisation (parsing JSON, enrichissement métier, mapping codes réseaux. . . ).

○ Vérification automatique des volumes attendus et du contenu des champs critiques (nulls, doublons, formatage) avec des scripts scala et shell.

○ Intégration des jobs dans Oozie avec XML + script Shell pour le déclenchement.

○ Supervision quotidienne des jobs via logs sur YARN et traitement des alertes (latence, erreurs Kafka, batchs échoués).

○ Packaging des jobs via SBT et Docker, gestion des dépendances, configuration via fichiers .conf par environnement (dev, qualif, prod).

○ Rédaction de README techniques pour chaque pipeline et mise à jour du wiki interne.

○ Mise en place de pipelines d'ingestion et d'exposition des données du Data Lake via Spark et Docker, avec déploiement automatisé CI/CD sur Jenkins.

○ Profiling par appétence web.
○ Text cleaning Engine.
Spark Intégration continue Gitlab CI/CD Natural Language Processing (NLP) Docker
BNP AM
Data Scientist/ Quantitative Analyst
BANQUE & ASSURANCES
février 2021 - janvier 2022 (11 mois)
Paris, France
Outils: Power BI, Python, Flask, Hadoop. Manipulation et diffusion des données ESG (Sustainalytics, Bloomberg, CDP, Trucost, ...)
○ Conception et développement des outils permetant d'ingérer et d'interroger des données liées à l'ESG (merge des données ESG provenant de plusieurs sources).
○ Amélioration d'un modèle de données de notation ESG spécifique pour un fond thématique.
○ Participation à l'architecture et l'implémentation d'un module de mapping de données providers.
○ création d'une interface utilisateur pour la visualisation des scores et indicateurs ESG.
ESG PySpark Scoring Bases de données Microsoft Power BI
Crédit Agricole CIB
Développeur Java Big Data
BANQUE & ASSURANCES
janvier 2019 - janvier 2021 (2 ans)
Paris, France
Outils: Spark, Jenkins, Hadoop, Java, hdfs, KAFKA, Hive, Shell, JPA, Springboot, web service REST/JSON, Pyspark, Zeppelin, maven.

Manipulation des données de risque de marché notamment, référentiels, les métriques ... dans un environnement Hadoop Hortonworks

○ Proposition d'une architecture d'un feeder de données.

○ Ingestion des données dans le data Lake, construit sur un cluster Hadoop Hortonworks.

○ mise en place de stratégies de tests.

○ mise à disposition des données du data lake via des microservices, des tables Hive, des fichiers .orc.

Apache Spark Java Hive Intégration continue

Consulter toutes les expériences de Ariane

Soyez le premier à recommander Ariane

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Mastère Spécialisé Big Data
Télécom ParisTech
2019
Machine Learning, Deep Learning, IA
Master en Mathématiques
Université de Padova - Scuola Galileiana degli Studi Superiori-SGSS
2017
Mathématiques, optimisation, statistiques

Consultez la formation qu'a suivie Ariane

Ariane Manintchap

Big Data Engineer/ Data Scientist

À propos de Ariane

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences

Catégories