Description

En tant que Data scientist disposant d'une expérience de 7 ans sur des problématiques opérationnelles telles que le risque de crédit, la détection de fraude ou encore le marketing CRM, j'ai pu acquérir des compétences techniques solides en Machine Learning qui me permettront de répondre à une grande diversité de besoins métiers.

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Espagnol
Capacité professionnelle limitée

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

Bouygues Telecom
Consultant Data scientist senior
TÉLÉCOMMUNICATIONS
mai 2022 - Aujourd'hui (4 ans et 1 mois)
Meudon, France
Contexte du projet :
Au sein du pôle Cellule Qualité du Fixe, l’équipe Data Science est responsable de l’identification des tendances problématiques sur les systèmes réseaux et informatiques permettant une anticipation des incidents techniques sur le périmètre du fixe (Internet et TV).
Pour ce faire, l’équipe est chargée de produire des rapports d’activité des services via des dashboards (Wi-Fi, latence, live, replay, …) et d’établir des modèles ou des KPI permettant de détecter les clients “souffrants” de problèmes techniques.
Résultats :
J’ai développé un modèle prédictif des problèmes de latence au niveau de la connexion en Wi-Fi des clients.
J’ai contribué à toutes les étapes de ce projet de la collecte de données jusqu’à l’industrialisation.
Ce modèle actuellement en production permet d’identifier quotidiennement les clients souffrants de problèmes de latence.
Je suis actuellement assigné à un autre projet similaire concernant cette fois-ci un indicateur de la qualité de service visant à noter la connexion Internet en Wi-Fi (couverture, stabilité, vitesse de la connexion).
Les clients souffrant de problèmes techniques détectés par cet indicateur feront l’objet de campagnes proactives (appels ou SMS) afin de leur proposer des solutions techniques.
Équipe : 17 personnes
Développement d’un modèle prédictif des problèmes de latence de la connexion Wi-Fi
• Ingestion des données avec Spark (données de latence HTTP, ping, DNS remontées toutes les 10 minutes par les box Internet),
• Feature Engineering (traitement et agrégation de séries temporelles),
• Développement du modèle de Machine Learning pour classifier les clients souffrants ou non de problèmes (Gradient Boosting)
• Echanges et ajustement du modèle avec les experts métier à partir d’indicateurs d’explicabilité du modèle (par exemple SHAP)
• Industrialisation du modèle via une pipeline Airflow pour alimenter quotidiennement une table mySQL
• Elaboration d’un dashboard sur Tableau permettant de visualiser la répartition des clients souffrants par produit, par région, par boucle réseau, …
Environnement technique :
Système (Windows 7, IBM AIX, Linux), Microsoft Office (Excel, PowerPoint, Word), Messagerie (Outlook), Langages (shell, Python), IDE (JupyterLab), Spark, AWS S3, Trino SQL, Apache Airflow, Tableau
Python SQL PySpark Jupyter Notebook Data science Machine Learning Clustering Apache Airflow AWS S3 Tableau HDFS
Canal+ International
Consultant Data scientist senior
CINÉMA & AUDIOVISUEL
janvier 2022 - mai 2022 (4 mois)
Boulogne-Billancourt, France
Contexte du projet :
Au sein du département Commercial & Marketing de Canal+ International, l’équipe d’Analyse et pilotage de la performance est chargée de produire des reportings visant à analyser le comportement des abonnés et la performance des campagnes marketings et de développer des outils d’aide à la décision, tels que des modèles prédictifs du churn.
Résultats :
J’ai développé un score prédictif du churn en utilisant des modèles de Machine Learning et en exploitant de nouvelles sources de données (données d’audience). J’ai également formé l’équipe au langage Python et à la Data Science afin de concrétiser sa transition du langage SAS vers Python et de pouvoir traiter les nombreux cas d’usage qui ont été identifiés (système de recommandation, scoring, …).
Équipe : 10 personnes
Développement de modèles de Machine Learning prédictifs du churn sur le périmètre Outre-mer
• Construction des bases de données (requêtage SQL depuis un datawarehouse Amazon Redshift) : adaptation de codes SAS en Python permettant l’extraction des différentes sources de données
• Ajout de nouvelles données d’usage : sessions de visionnage des abonnés permettant de créer de nouveaux indicateurs de leurs habitudes de consommation (durée de consommation par genre de programme, par support de visionnage, …)
• Développement d’un modèle de Gradient Boosting (Minimum Viable Product) avec une amélioration significative des performances de prédiction du churn (détection de 58% de l’effectif total des clients fragiles dans le top 20% des clients avec la plus forte probabilité prédite de churn) en comparaison avec le score actuel.
Formation de l’équipe d’Analyse et pilotage de la performance à la Data Science et au langage Python
• Animation de 6 sessions de 2 jours avec une montée en compétence progressive sur des notions clé de la Data Science en Python
• Adaptation de la formation à l’environnement de développement interne (JupyterLab sur des instances Amazon EC2) et au système de gestion de bases de données interne (datawarehouse Amazon Redshift, datalake Amazon S3)
• Cas pratiques d’application des notions de Data Science et du langage Python sur les données internes de l’équipe (données utilisées pour le cas d’usage du scoring)
Environnement technique :
Système (Windows 7, IBM AIX, Linux), Microsoft Office (Excel, PowerPoint, Word), Messagerie (Outlook), Langages (shell, Python, SAS), IDE (JupyterLab), AWS RedShift/S3
Python Data science Machine learning Jupyter Notebook SAS Amazon Redshift AWS S3
BNP Paribas Personal Finance
Data Scientist
BANQUE & ASSURANCES
octobre 2017 - juillet 2021 (3 ans et 10 mois)
Levallois-Perret, France
Contexte du projet :
Au sein du département des risques dans les fonctions centrales, l’équipe du Centre de Scoring est chargée du développement de modèles prédictifs du risque de crédit et de la fraude pour l’ensemble des entités de BNPP PF à l’international.
Résultats :
L’industrialisation des modèles prédictifs en temps réel au sein des systèmes d’information ainsi que l’insertion de ces modèles dans le processus opérationnel permet de répondre aux besoins métiers des entités : automatiser la décision d’octroi d’un crédit, de détecter la fraude, de faire du pricing, de la gestion de découvert, etc.
Équipe : 25 personnes
Développement de modèles de Machine Learning pour les entités du groupe BNP Paribas
● Modèle Machine Learning de détection de fraude sur les demandes de crédit du web de Cetelem en France industrialisé via une API sous le framework FastAPI
● Catégorisation de verbatims de conseillers du Centre Relation Client pour détecter les suspicions de fraude documentaire ou d’usurpation d’identité afin de labelliser les clients
● Modèle de Machine Learning d’octroi de crédit sur les demandes de clients connus de Cetelem en Bulgarie industrialisé avec la technologie Predictive Model Markup Language
● Modèle de régression pour l’estimation du paramètre LGD dans le cadre de la réglementation Bâle II
Cadrage et rédaction de la méthodologie de modélisation et de sa mise en oeuvre
● Documentation guidelines de développement d’un modèle de score Machine Learning
● Documentation des best practices en développement Python respectant les normes et standards de développements requis pour l’industrialisation des modèles
● Documentation sur les recommandations de monitoring des modèles Machine Learning en production
Formation en interne des équipes du département des risques au langage Python et à la Data Science
● Élaboration de supports de formation pour une montée en compétences sur les grandes étapes des projets de développement de modèles Machine Learning: ETL, Feature Engineering, algorithmes et modèles statistiques, ...
● Animation d’une formation technique d’une semaine et accompagnement des participants
Contribution active à la veille technologique en Machine Learning et au développement de packages et utilitaires internes à l’équipe
● Élaboration d’une méthodologie visant à expliquer les modèles Machine Learning blackbox et développement d’un package Python mettant en oeuvre cette méthodologie
● Proof of Concept sur la solution AIML de Zest AI : package Python permettant de cadrer et automatiser le développement de modèle de Machine Learning pour le scoring en risque de crédit par l’encapsulation de plusieurs briques fonctionnelles : Exploratory Data Analysis, Feature Engineering, optimisation du modèle ML, indicateurs de performance et d’interprétabilité, génération automatique de la documentation technique du modèle, ...
Compétences MLOPS
• Tests unitaires dans une pipeline GitLab CI/CD : pytest, pylint, flake8, rapport SonarQube (contraintes de qualité de code : couverture des tests, dette technique inférieure à 1 heure, …)
• Développement d’une API via FastAPI permettant de calculer en temps réel la probabilité de fraude prédite par un modèle de Machine Learning (requête POST HTTPS)
• Utilisation d’un espace de stockage AWS S3-compatible (object storage MinIO) afin de collecter des données externes (Open Data de l’INSEE) pour enrichir les données utilisées pour calculer les prédictions d’un modèle ML via une API
Environnement technique :
Système (Windows 7, IBM AIX, Linux), Microsoft Office (Excel, PowerPoint, Word), Messagerie (Outlook), Langages (shell, Python, R, SAS), IDE (VScode)
Python SAS Machine Learning Statistiques Risque de crédit Fraude Jupyter notebook VSCode Bash Gitlab CI/CD AWS S3 API REST Réglementation bancaire

Consulter toutes les expériences de Brik

Soyez le premier à recommander Brik

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Ingénieur diplômé de l’Institut National des Sciences Appliquées de Rouen, spécialité Génie Mathématique
INSA de Rouen
2016
Fiche RNCP : https://www.francecompetences.fr/recherche/rncp/15667/
Master 2 AIMAF
Université de Rouen
2016
Le Master professionnel Actuariat et ingénierie mathématique en assurance et finance (AIMAF) est une formation théorique et pratique qui permet aux étudiants de maîtriser les méthodes statistiques, numériques et informatiques, utilisées dans les métiers de la finance et de l'assurance, notamment dans la gestion des risques financiers. L'objectif est de former des cadres à profil d'ingénieurs mathématiciens spécialisés dans les applications des mathématiques aux problèmes financiers, économiques et maîtrisant les outils de la finance et de l'assurance. Cette formation permet de mieux appréhender la complexité des mouvements financiers afin d'améliorer la prévision des risques inhérents. Elle prend ainsi en compte l'essor considérable de l'utilisation de modèles mathématiques déterministes ou stochastiques, des modélisations financières et économiques et de la simulation numérique. Les secteurs d'application sont très variés : banques, compagnies d'assurance, cabinets d'actuaires, services de gestion de production, bureaux d'études de grandes et moyennes entreprises.