À propos de Brik
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Espagnol
Capacité professionnelle limitée
Expériences
- Bouygues TelecomConsultant Data scientist seniorTÉLÉCOMMUNICATIONSmai 2022 - Aujourd'hui (4 ans et 1 mois)Meudon, FranceContexte du projet :Au sein du pôle Cellule Qualité du Fixe, l’équipe Data Science est responsable de l’identification des tendances problématiques sur les systèmes réseaux et informatiques permettant une anticipation des incidents techniques sur le périmètre du fixe (Internet et TV).Pour ce faire, l’équipe est chargée de produire des rapports d’activité des services via des dashboards (Wi-Fi, latence, live, replay, …) et d’établir des modèles ou des KPI permettant de détecter les clients “souffrants” de problèmes techniques.Résultats :J’ai développé un modèle prédictif des problèmes de latence au niveau de la connexion en Wi-Fi des clients.J’ai contribué à toutes les étapes de ce projet de la collecte de données jusqu’à l’industrialisation.Ce modèle actuellement en production permet d’identifier quotidiennement les clients souffrants de problèmes de latence.Je suis actuellement assigné à un autre projet similaire concernant cette fois-ci un indicateur de la qualité de service visant à noter la connexion Internet en Wi-Fi (couverture, stabilité, vitesse de la connexion).Les clients souffrant de problèmes techniques détectés par cet indicateur feront l’objet de campagnes proactives (appels ou SMS) afin de leur proposer des solutions techniques.Équipe : 17 personnesDéveloppement d’un modèle prédictif des problèmes de latence de la connexion Wi-Fi• Ingestion des données avec Spark (données de latence HTTP, ping, DNS remontées toutes les 10 minutes par les box Internet),• Feature Engineering (traitement et agrégation de séries temporelles),• Développement du modèle de Machine Learning pour classifier les clients souffrants ou non de problèmes (Gradient Boosting)• Echanges et ajustement du modèle avec les experts métier à partir d’indicateurs d’explicabilité du modèle (par exemple SHAP)• Industrialisation du modèle via une pipeline Airflow pour alimenter quotidiennement une table mySQL• Elaboration d’un dashboard sur Tableau permettant de visualiser la répartition des clients souffrants par produit, par région, par boucle réseau, …Environnement technique :Système (Windows 7, IBM AIX, Linux), Microsoft Office (Excel, PowerPoint, Word), Messagerie (Outlook), Langages (shell, Python), IDE (JupyterLab), Spark, AWS S3, Trino SQL, Apache Airflow, Tableau
- Canal+ InternationalConsultant Data scientist seniorCINÉMA & AUDIOVISUELjanvier 2022 - mai 2022 (4 mois)Boulogne-Billancourt, FranceContexte du projet :Au sein du département Commercial & Marketing de Canal+ International, l’équipe d’Analyse et pilotage de la performance est chargée de produire des reportings visant à analyser le comportement des abonnés et la performance des campagnes marketings et de développer des outils d’aide à la décision, tels que des modèles prédictifs du churn.Résultats :J’ai développé un score prédictif du churn en utilisant des modèles de Machine Learning et en exploitant de nouvelles sources de données (données d’audience). J’ai également formé l’équipe au langage Python et à la Data Science afin de concrétiser sa transition du langage SAS vers Python et de pouvoir traiter les nombreux cas d’usage qui ont été identifiés (système de recommandation, scoring, …).Équipe : 10 personnesDéveloppement de modèles de Machine Learning prédictifs du churn sur le périmètre Outre-mer• Construction des bases de données (requêtage SQL depuis un datawarehouse Amazon Redshift) : adaptation de codes SAS en Python permettant l’extraction des différentes sources de données• Ajout de nouvelles données d’usage : sessions de visionnage des abonnés permettant de créer de nouveaux indicateurs de leurs habitudes de consommation (durée de consommation par genre de programme, par support de visionnage, …)• Développement d’un modèle de Gradient Boosting (Minimum Viable Product) avec une amélioration significative des performances de prédiction du churn (détection de 58% de l’effectif total des clients fragiles dans le top 20% des clients avec la plus forte probabilité prédite de churn) en comparaison avec le score actuel.Formation de l’équipe d’Analyse et pilotage de la performance à la Data Science et au langage Python• Animation de 6 sessions de 2 jours avec une montée en compétence progressive sur des notions clé de la Data Science en Python• Adaptation de la formation à l’environnement de développement interne (JupyterLab sur des instances Amazon EC2) et au système de gestion de bases de données interne (datawarehouse Amazon Redshift, datalake Amazon S3)• Cas pratiques d’application des notions de Data Science et du langage Python sur les données internes de l’équipe (données utilisées pour le cas d’usage du scoring)Environnement technique :Système (Windows 7, IBM AIX, Linux), Microsoft Office (Excel, PowerPoint, Word), Messagerie (Outlook), Langages (shell, Python, SAS), IDE (JupyterLab), AWS RedShift/S3
- BNP Paribas Personal FinanceData ScientistBANQUE & ASSURANCESoctobre 2017 - juillet 2021 (3 ans et 10 mois)Levallois-Perret, FranceContexte du projet :Au sein du département des risques dans les fonctions centrales, l’équipe du Centre de Scoring est chargée du développement de modèles prédictifs du risque de crédit et de la fraude pour l’ensemble des entités de BNPP PF à l’international.Résultats :L’industrialisation des modèles prédictifs en temps réel au sein des systèmes d’information ainsi que l’insertion de ces modèles dans le processus opérationnel permet de répondre aux besoins métiers des entités : automatiser la décision d’octroi d’un crédit, de détecter la fraude, de faire du pricing, de la gestion de découvert, etc.Équipe : 25 personnesDéveloppement de modèles de Machine Learning pour les entités du groupe BNP Paribas● Modèle Machine Learning de détection de fraude sur les demandes de crédit du web de Cetelem en France industrialisé via une API sous le framework FastAPI● Catégorisation de verbatims de conseillers du Centre Relation Client pour détecter les suspicions de fraude documentaire ou d’usurpation d’identité afin de labelliser les clients● Modèle de Machine Learning d’octroi de crédit sur les demandes de clients connus de Cetelem en Bulgarie industrialisé avec la technologie Predictive Model Markup Language● Modèle de régression pour l’estimation du paramètre LGD dans le cadre de la réglementation Bâle IICadrage et rédaction de la méthodologie de modélisation et de sa mise en oeuvre● Documentation guidelines de développement d’un modèle de score Machine Learning● Documentation des best practices en développement Python respectant les normes et standards de développements requis pour l’industrialisation des modèles● Documentation sur les recommandations de monitoring des modèles Machine Learning en productionFormation en interne des équipes du département des risques au langage Python et à la Data Science● Élaboration de supports de formation pour une montée en compétences sur les grandes étapes des projets de développement de modèles Machine Learning: ETL, Feature Engineering, algorithmes et modèles statistiques, ...● Animation d’une formation technique d’une semaine et accompagnement des participantsContribution active à la veille technologique en Machine Learning et au développement de packages et utilitaires internes à l’équipe● Élaboration d’une méthodologie visant à expliquer les modèles Machine Learning blackbox et développement d’un package Python mettant en oeuvre cette méthodologie● Proof of Concept sur la solution AIML de Zest AI : package Python permettant de cadrer et automatiser le développement de modèle de Machine Learning pour le scoring en risque de crédit par l’encapsulation de plusieurs briques fonctionnelles : Exploratory Data Analysis, Feature Engineering, optimisation du modèle ML, indicateurs de performance et d’interprétabilité, génération automatique de la documentation technique du modèle, ...Compétences MLOPS• Tests unitaires dans une pipeline GitLab CI/CD : pytest, pylint, flake8, rapport SonarQube (contraintes de qualité de code : couverture des tests, dette technique inférieure à 1 heure, …)• Développement d’une API via FastAPI permettant de calculer en temps réel la probabilité de fraude prédite par un modèle de Machine Learning (requête POST HTTPS)• Utilisation d’un espace de stockage AWS S3-compatible (object storage MinIO) afin de collecter des données externes (Open Data de l’INSEE) pour enrichir les données utilisées pour calculer les prédictions d’un modèle ML via une APIEnvironnement technique :Système (Windows 7, IBM AIX, Linux), Microsoft Office (Excel, PowerPoint, Word), Messagerie (Outlook), Langages (shell, Python, R, SAS), IDE (VScode)
Recommandations
Soyez le premier à recommander Brik
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Ingénieur diplômé de l’Institut National des Sciences Appliquées de Rouen, spécialité Génie MathématiqueINSA de Rouen2016Fiche RNCP : https://www.francecompetences.fr/recherche/rncp/15667/
- Master 2 AIMAFUniversité de Rouen2016Le Master professionnel Actuariat et ingénierie mathématique en assurance et finance (AIMAF) est une formation théorique et pratique qui permet aux étudiants de maîtriser les méthodes statistiques, numériques et informatiques, utilisées dans les métiers de la finance et de l'assurance, notamment dans la gestion des risques financiers. L'objectif est de former des cadres à profil d'ingénieurs mathématiciens spécialisés dans les applications des mathématiques aux problèmes financiers, économiques et maîtrisant les outils de la finance et de l'assurance. Cette formation permet de mieux appréhender la complexité des mouvements financiers afin d'améliorer la prévision des risques inhérents. Elle prend ainsi en compte l'essor considérable de l'utilisation de modèles mathématiques déterministes ou stochastiques, des modélisations financières et économiques et de la simulation numérique. Les secteurs d'application sont très variés : banques, compagnies d'assurance, cabinets d'actuaires, services de gestion de production, bureaux d'études de grandes et moyennes entreprises.
Certifications
- Data Scientist Professional CertificateDataCamp2022