À propos de Nogaye
- Développement et déploiement de modèles IA
- Conception de pipelines et industrialisation de modèle ML/MLOps avec Kedro, MLflow, Docker
- IA générative appliquée au traitement et structuration de données textuelles (RAG, LLM, embeddings)
- Analyse de données avancée (Python, SQL, visualisation avec Tableau, Power BI)
- Communication des résultats et vulgarisation pour les équipes métiers
Wolof
Bilingue ou natif
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- Service & Secure Payment (SSP)Data scientist/AI Engineer (Lead technique)BANQUE & ASSURANCESseptembre 2024 - Aujourd'hui (1 an et 9 mois)Paris, FranceProjet de scoring de fraude client
- Pilotage de bout en bout du projet, de la phase de cadrage avec les équipes métiers et commerciales jusqu’à la mise en production et le suivi des performances.
- Recueil et formalisation des besoins métiers: définition des cas d’usage, des KPIs et des critères de performance des modèles en lien avec les enjeux business.
- Encadrement d’un Data Analyst: répartition des tâches, suivi des livrables, accompagnement technique et montée en compétence.
- Conception et mise en œuvre de pipelines de données: extraction des données avec SQL, nettoyage, transformation et préparation des datasets.
- Création de features pertinentes à partir de données pour améliorer la performance des modèles.
- Développement, entraînement et évaluation de modèles prédictifs supervisés de type boosting (XGBoost, LightGBM, CatBoost) pour la détection des fraudes sur les paiements par chèque.
- Industrialisation des workflows ML avec Kedro: pipelines de traitement, entraînement, validation et suivi des modèles.
- Gestion des expérimentations avec MLflow: logging des métriques et hyperparamètres, comparaison des modèles, gestion des runs, promotion des meilleurs modèles vers le Model Registry et tagging pour tests et production.
- Développement et déploiement d’une API FastAPI: exposition des modèles en production, gestion des requêtes et containerisation Docker pour le déploiement.
- Organisation d’ateliers avec les équipes métiers: pour présenter et analyser les résultats des modèles de scoring, recueillir leurs retours et définir conjointement des recommandations adaptées aux besoins spécifiques de SSP.
- Analyse de données financières avec Tableau Desktop
- SSPData scientist/AI EngineerBANQUE & ASSURANCESseptembre 2024 - Aujourd'hui (1 an et 9 mois)Paris, FrancePOC – Développement d’un système RAG sur données juridiques publiques (Code monétaire et financier)
- POC – Développement d’un système RAG sur données juridiques publiques (Code monétaire et financier)
- Conception et développement d’un pipeline RAG pour l’interrogation de corpus juridiques.
- Segmentation et chunking hiérarchique des textes juridiques (livres, chapitres, articles, alinéas) à l’aide de regex Python et de LangChain.
- Génération d’embeddings avec des LLMs.
- Indexation et recherche vectorielle via Milvus (base de données vectorielle).
- Orchestration du pipeline RAG avec LangChain.
- Intégration de modèles de langage via AWS Bedrock : consommation de LLMs (type Mistral / modèles équivalents) pour la génération de réponses.
- Mise en place d’architectures d’appel aux modèles (inference API) avec gestion des prompts, du contexte et des réponses.
- Prompt engineering avancé pour la génération de réponses juridiques contextualisées et fiables.
- AKKODIS Research,Data ScientistINGÉNIERIE MÉCANIQUEmars 2022 - juillet 2024 (2 ans et 4 mois)Paris, FranceMissions et tâches:Projet de génération de CV à partir d'audios pour ADECCO
- Transcription d'audios avec le modèle de reconnaissance vocale Wishper avec Azure Machine Learning
- Fine-tuning du LLM T5 avec Azure Machine LearningDétection de paternes avec CamemBERT et spacy
- Mise en place d’un pipeline NLP complet : nettoyage des textes, tokenisation, lemmatisation, embeddings et extraction d’informations
Projet d'assistance à la maintenance prédictive pour la SNCF- Application de NLP aux tickets de résolution IT pour la maintenance prédictive: avec les modèles préentraînés de Hugging Face pour les adapter aux besoins spécifiques du projet.
- Exploitation de modèles LLM de Hugging Face (BERT, CamemBERT, RoBERTa) pour l’analyse des tickets IT et l’extraction automatique d’informations structurées.
- Application de modèles de NLP pour extraire des informations significatives à partir des notes de résolution(texte).
- Réalisation d’un pipeline NLP complet : nettoyage des textes, tokenisation, lemmatisation, embeddings et extraction d’informations
- Utilisation de NLP pour analyser les notes de résolution de manière approfondie.
- Rédaction de rapports techniques détaillés: pour documenter les méthodes et les résultats.
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Master of Data ScienceUniversité Paris-Saclay2021Master Data Science en alternance , Traitement des données
- Licence, InformatiqueUniversité Paris-Sud2019Licence, Informatique