À propos de Benjamin
Lead AI Engineer | 10 ans XP | GenAI · Agents IA · RAG · MLOps
Ce que je construis pour vous :
- Agents IA & Systèmes multi-agents : agents autonomes pour automatiser vos workflows bout-en-bout — extraction de données, génération de documents, intégration à vos outils existants (ERP, SaaS, APIs internes). Architecture LangGraph, PydanticAI
- RAG & Chat avec vos données : un assistant IA qui lit vos fichiers internes (PDF, Excel, SQL), comprend les questions en langage naturel et répond avec précision — déployé sur vos serveurs, confidentialité garantie
- Fine-tuning & LLM sur mesure : adaptation de modèles open source (LoRA/QLoRA) à votre métier et vos données propriétaires pour des performances calibrées sur vos cas d'usage
- MLOps & Industrialisation. Du notebook à la prod : API FastAPI, CI/CD, monitoring MLflow, analyse de drift. Ce qui est livré tourne, et continue de tourner
Pourquoi moi ?
- 10 ans d'expérience, du Data Scientist au Lead AI Engineer en grand groupe
- Réalisations en production à grande échelle — pas des démos
- Double culture technique + métier : je comprends vos enjeux avant de coder
- Enseignant en Master Data Science pendant 7 ans — je vulgarise et embarque vos équipes
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Expériences
- CEGIDAI engineerEDITION DE LOGICIELSoctobre 2022 - Aujourd'hui (3 ans et 8 mois)Paris, FranceCegid est un éditeur de logiciels de référence en France, spécialisé dans les solutions de comptabilité, paie et RH à destination des entreprises et cabinets comptables. Au sein d'une équipe dédiée de 6 à 7 personnes, j'ai occupé le rôle de Lead AI Engineer avec pour mission d'évaluer l'apport de l'IA générative sur les problématiques métier des produits Cegid, puis de concevoir et déployer les solutions retenues. L'équipe intervenait en transverse sur plusieurs produits, de l'analyse du besoin jusqu'à la mise en production:
- Pilotage technique de l'équipe GenAI/data (6-7 personnes) : définition des architectures, choix des modèles LLM (Azure OpenAI, Mistral, Gemini), coordination avec les partenaires technologiques et les parties prenantes métier (PO, PM, CSM) pour identifier et prioriser les opportunités IA sur les produits
- Création d’un système multi-agents et RAG pour extraire les informations des factures, venant remplacer les modèles de machine learning historiques. Ce système traite plusieurs centaines de milliers de factures par jour en quelques dizaines de secondes par facture
- Fine tune d’un modèle à 7B de paramètre via QLoRA pour améliorer la classification comptable (réduction des erreurs de près de 20%)
- Développement d'un système agentique mêlant speech-to-text et RAG permettant d'interpréter la dictée utilisateur et de générer automatiquement une facture complète et valide dans nos outils comptables
- Conception et déploiement en production d'un système multi-agents générant automatiquement des déclarations de TVA préremplies à partir de l'analyse de factures, intégré aux produits SaaS Cegid
- Consolidation des modèles de machine learning en production : MLflow, CI/CD, tests unitaires, KPIs de performance, analyse du drift — sur les modèles de computer vision et NLP historiques
- KojiLead Data ScientistAGENCE & SSIIseptembre 2021 - septembre 2022 (1 an)Paris, FranceKOJI est une entreprise de développement web et applicatif en forte croissance, souhaitant ouvrir une BU data. J'ai accompagné cette création en couvrant deux dimensions : répondre aux besoins data de leurs clients et structurer la BU en interne :
- Construction d'un data warehouse centralisé via pipelines ELT, consolidant les données de l'ensemble des outils internes (communication, RH, facturation) avec dashboards à destination des chefs de projet et associés
- Développement et mise en production d'un algorithme de recommandation produits (deep learning) pour un acteur majeur de la restauration rapide en Angleterre, déployé sous forme d'API — gain effectif de 15% à 25% sur les ventes
- Structuration de la BU data : rédaction des réponses aux appels d'offres, recueil des besoins métier clients, proposition de solutions fonctionnelles et gestion du backlog
- OpenClassroomsRéférent technique dataEDUCATION & E-LEARNINGseptembre 2020 - septembre 2021 (1 an)Paris, FranceL'enseignement à OpenClassRooms se fait en format 1 on 1, avec un mentor attribué à chaque étudiant qui prend le temps quotidiennement de l'accompagner et de le former.C'est dans ce cadre que je suis intervenu en tant que mentor (depuis 2018), créateur de contenu pour leurs différents parcours data, mais surtout référent technique du parcours data analyst sur l'année scolaire 2020-2021 :- Rédaction de contenus pédagogiques en Français et Anglais- Refonte du parcours data analyst (fin 2020)- Mentorat d’étudiants sur les parcours Data Analyst et Data Science- Rédaction de ressources pédagogiques (cours, projets & webinar) en Français et en Anglais- Suivi des performances du parcours, amélioration/mise à jour des projets et cours existant
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Master statistiques pour l'évaluation et la prospectiveUniversité de Reims Champagne-Ardennes2015