À propos de Jeremy
Machine Learning Engineer | MLOps | Specialiste Document AI
Au cours de ma carrière, j'ai réalisé pour mes clients:
Anglais
Capacité professionnelle complète
Français
Bilingue ou natif
Expériences
- SAPMachine Learning EngineerEDITION DE LOGICIELSjuin 2025 - Aujourd'hui (1 an)Prague, TchéquieEPAM Systems est une entreprise internationale de services technologiques et d'ingénierie logicielle. Dans le cadre de sa collaboration avec SAP, j'ai été missionné pour concevoir et déployer une solution d'IA d'entreprise destinée à l'équipe Communications de SAP.L'objectif : mettre en place d'un RAG à partir de sources d'actualités internes.J'ai piloté le projet en tant que Tech Lead, de la phase POC jusqu'à la mise en production. L'équipe technique était composée comme suit :1 Lead Group3 Data ScientistsPrincipaux résultats :🔷 Mise en production d'une solution d'IA d'entreprise basée sur le Retrieval Augmented Generation (RAG). Le produit compte près de 10 utilisateurs, et continue à s'étendre aux autres membres de l'équipe.🔷 Développement de pipelines d'ingestion de données à grande échelle. 50+ documents indéxés de manière quotidienne via Azure Databricks. Cette infrastructure garantit un accès instantané aux informations en date.🔷 Accélération des cycles de développement. Refactorisation du Back-End et automatisation des pipelines CI/CD -> réduction de mise en production de plusieurs semaines à quelques jours, permettant une itération rapide et continue.Contexte technique :Python — Azure Databricks — CI/CD — Embedding Models — API — Clean Code — Docker — Git — GitHub — LLM — NLP — Machine Learning — Data Engineering
- AlmaMachine Learning EngineerEDITION DE LOGICIELSfévrier 2025 - mars 2025 (1 mois)Ottawa, CanadaAlma est une start-up Canadienne ayant pour objectif de rendre le tracking alimentaire un jeu d'enfant grâce à l'AI. J'ai rejoint la team en tant que Machine Learning Engineer pour intégrer et exploiter des databases alimentaires open-source, tels qu'Open Food Facts ou USDA.L'équipe était composée de :
- 1 CEO
- 1 CTO
- 3 IOS Developers
En étroite collaboration avec le CEO et CTO, j'ai pu:🥗 Intégrer les databases open-source à la database relationnelle Postgres. Au total, c'est plus de 2.5 millions de produits ajoutés au catalogue de la start-up. Cela a aussi permit à la start-up de devenir indépendant des API payantes telles FatSecret ou Edamam.🥗 Améliorer la pipeline RAG destinée à retourner le bon aliment basé sur la requête utilisateur. Le nouvel algorithme est plus économique en terme d'appel LLMs en plus de réduire le temps de réponse.🥗 Collaboration sur le développement Back-End pour répondre aux besoins des IOS developers. - Open Food FactsMachine Learning EngineerEDITION DE LOGICIELSmars 2024 - novembre 2024 (7 mois)Paris, FranceOpen Food Facts est une organisation française open-source. Sa mission est de créer la plus grande base de données alimentaire gratuite et ouverte au monde. À ce jour, elle comprend plus de 3,5 millions de produits dans 150 pays. Elle est soutenue par plus de 12 000 contributeurs actifs à travers le monde.J'ai rejoint l'équipe centrale d'Open Food Facts pour développer et intégrer des fonctionnalités de ML sous forme de microservices. L'équipe technique était composée comme suit :1 ingénieur Full-stack1 ingénieur ML1 DevOps1 développeur MobilePrincipaux résultats :🍊 Correcteur orthographique d'ingrédients : Les erreurs dans les ingrédients extraits par OCR compromettaient l'analyse de la composition des produits. J'ai développé un système de correction orthographique par le fine-tune de LLMs open-source. La solution est déployée sur GCP et est 100 fois moins chère que GPT-4o. Cette fonctionnalité a augmenté de 11 % le nombre d'ingrédients identifiés.🍊 Détection de cultures : J'ai déployé un modèle de détection d'objets (YOLO-v8) sur mobile en utilisant TensorFlow Lite. Cette fonctionnalité améliore l'expérience utilisateur et accélère le processus de contribution.🍊 Optimisation de la base de données : En utilisant DuckDB et Arrow, j'ai compressé la base de données de 43 Go à 6 Go. Il est maintenant plus facile pour les utilisateurs et les entreprises d'exploiter la base de données open-source. Nous utilisons Hugging Face pour l'hébergement, améliorer l'accessibilité et alléger les serveurs.🍊 Engagement communautaire : J'ai activement participé à des initiatives pour soutenir la croissance et la collaboration de la communauté.Contexte technique :Python - Metaflow - DuckDB - AWS - Sagemaker - GCP - API - Clean code - Argilla - vLLM - Docker - Typer - Bash - GIt - GitHub - LLM - NLP - GPUs - Machine Learning - Data science
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- DoctoratUniversité de Nantes2021Thèse CIFRE en partenariat avec EDF, TOTAL & le LTEN
- IngénieurENSEM2016Computer science et Ingénierie
Certifications
- The Data Science Course 2022: Complete Data Science Bootcamp365DataScience2022
- Natural Language Processing SpecialisationDeepLearning AI2022