- Industrialisation de POC pour projet stratégique
- Identification des briques technologique en environnement Microsoft Azure
- Mise en place des environnement (HdInsight, azure Databricks, CosmosDB, Azure Data Lake, Azure Devops, ...)
- Développement de solution générique pour le calcul des KPIs métiers en PySpark
- Mise en production des solutions et accompagnement
- Devops en environnment CLOUDERA (
- Architecture technologique de solution (Delta Parque, Hbase, Hive/Impala, CDC)
- Developpement de solutions Big Data sur plusieurs projets métiers utilisant (Spark/Scala, Hbase, Kafka, Hive/Impala)
- Developpement de solutions Big Data sur plusieurs projets métiers utilisant (PySpark, Kafka, Hive/Impala, Teradata, SAS)
- Partage d’expérience sur les technologie Big Data
- Mise en place des solutions algorithmiques et des architectures technologiques les mieux adaptées (Spark/Scala/Python, Hadoop/Hive/Impala, Cassandra, Elasticsearch)
- Optimisation des algorithmes et chaines de calcul
- Analyse des LOGS (Search, booking, …)
- Assistance à l’administration de Cluster Hadoop (Cloudera Manager : Upgrade + configurations)
- Scoring and Clustering on Hadoop and Spark
- Hive : data manipulation on Hadoop
- Python, R and Pig scripting for Big Data
- oozie for job scheduling on Hadoop
- Conception et optimisation d’algorithmes et de méthodes pour le calcul des
profils des internautes (Scoring et Clustering avec Mahout sur HADOOP, R)
- Mise en place de POC d’architecture BIG DATA et traitement fil de l’eau pour le
profilage des cookies (Hadoop, STORM)
- Développement de marqueurs de Pub pour le calcul des indicateurs liés au PUB
servies par les AD-SERVEUR et les AD-EXHANGE
- Conception et réalisation d’outils d’aide à la décision pour la visualisation et le
monitoring des réseaux, l’analyse et la classification des clients Télécom.
- Théorie des graphes, clustering, théorie des jeux et marches aléatoires dans les
réseaux.
- Etude et analyse des réseaux sociaux