You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Hugo PrevoteauHP

Hugo Prevoteau

Data Scientist (NLP, LLM, ASR)

400 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Hugo

🧠 Ingénieur en Intelligence Artificielle avec 4+ ans d’expérience, je conçois des solutions sur-mesure en NLP, LLM, ASR et RAG pour automatiser les processus métier, optimiser les performances et créer des leviers de croissance par la donnée.

🚀 Après un parcours mêlant recherche appliquée et industrie (Amazon Alexa AI), j’ai fondé Yula Studio, où j’aide les entreprises à intégrer les dernières avancées en IA générative (GPT, LLaMA, Mistral, agents IA, vector databases) à leurs outils et systèmes existants.

🔍 Expertises clés :
• NLP / LLM : classification d’emails, extraction d’informations, génération de texte, fine-tuning de modèles pré-entraînés (GPT, BERT, LLaMA, Mistral)
• ASR / Speech-to-Text : modèles low-resource, adaptation multilingue (Alexa Arabic, FireTV), rescoring, data augmentation
• RAG & Agents IA : vector search, génération augmentée par les données, systèmes multi-agents intelligents (LangChain, Pinecone)
• ML & Data Engineering : pipelines de traitement, structuration de bases de données, modèles supervisés et non supervisés

🛠️ Stack technique :
Python (PyTorch, TensorFlow, LangChain, FastAPI) – AWS (SageMaker, EC2) – Docker – Pinecone – Neo4j – React – Heroku

🤝 J’interviens sur tout le cycle de vie d’un projet IA : cadrage, prototypage, mise en production, accompagnement post-livraison. À l’aise en autonomie ou intégré à vos équipes, je m’adapte à vos enjeux métiers comme techniques.

📬 Discutons de vos besoins en IA : un audit rapide, un prototype ou une intégration clé en main ? Je vous propose une solution pragmatique et personnalisée.
  • Français

    Bilingue ou natif

  • Anglais

    Bilingue ou natif

  • Espagnol

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Yula
    Chief Technology Officer
    novembre 2023 - Aujourd'hui (2 ans et 7 mois)
    Paris, France
    Développement de systèmes RAG (Retrieval-Augmented Generation) pour automatiser le service client e-commerce avec des LLM

    • Conception et déploiement d’une solution RAG (Retrieval-Augmented Generation) basée sur des grands modèles de langage (LLM) afin d’automatiser les réponses aux demandes clients, avec un impact mesurable sur l’efficacité opérationnelle, la précision des réponses et la satisfaction utilisateur.
    • Création d’un pipeline de données NLP complet pour l’extraction, le nettoyage, l’indexation et le stockage vectoriel de contenus textuels, garantissant une récupération rapide et pertinente des documents.
    • Mise en œuvre d’une architecture modulaire combinant systèmes multi-agents et LLMs pour une gestion intelligente des interactions complexes avec les utilisateurs.
    • Recrutement et coordination d’une équipe pluridisciplinaire (Front-End, Full Stack, Machine Learning Engineer) pour assurer la conception, le déploiement et l’amélioration continue des services IA en production.
    • Encadrement technique des choix d’architecture et des bonnes pratiques de développement collaboratif sur des applications mêlant intelligence artificielle et interfaces web performantes.

    Technologies : LangChain, Pinecone, FastAPI, React, Remix, Heroku

    Mots-clés : RAG, LLM, NLP, retrieval-augmented generation, multi-agent systems, chatbot, vector database, Python, FastAPI, LangChain, React, Heroku, e-commerce automation
  • Amazon
    Applied Scientist
    août 2021 - novembre 2023 (2 ans et 3 mois)
    London, UK
    Expert en reconnaissance vocale (ASR) spécialisée dans les environnements low-resource

    • Développement de modèles ASR RNN-T performants dans des contextes à faibles ressources, avec intégration de données hétérogènes (données réelles et synthétiques), ayant permis une réduction relative du WER de 83 %.
    • Mise en place d’un cadre d’apprentissage incrémental réduisant les coûts d’entraînement de 75 %, optimisant les itérations en production.
    • Spécialisation en adaptation au domaine et à la localisation via la génération de données audio synthétiques, pour des systèmes de reconnaissance vocale par requête vocale (voice search) basés sur des modèles pré-entraînés.
    • Optimisation des performances grâce à des techniques avancées de rescoring : first pass shallow fusion, Internal Language Model Estimation (ILME), RescoreBERT, ayant permis une réduction relative de 8 % du WER.
    • Maîtrise de la préparation des données, de l’augmentation de données audio, du transfer learning, de l’incremental learning et du fine-tuning de modèles ASR. Expérience dans le data source weight mixing pour améliorer la robustesse et la précision des modèles.

    Technologies : RNN-T, Whisper, Kaldi, ESPnet, HuggingFace Transformers, PyTorch, TensorFlow, wav2vec 2.0, BERT, RescoreBERT

    Mots-clés : speech recognition, ASR, WER, RNN-T, domain adaptation, language model fusion, synthetic audio, low-resource ASR, incremental learning, fine-tuning, audio data augmentation
  • Amazon
    Applied Scientist
    février 2021 - juillet 2021 (5 mois)
    Barcelona, Spain
    Recherche appliquée sur la scalabilité des modèles de MARL (Multi-Agent Reinforcement Learning) avec un nombre d’agents dynamique

    • Étude avancée sur la scalabilité des modèles de renforcement multi-agent (MARL) dans des contextes où le nombre d’agents varie à l’inférence, un défi clé pour les applications temps réel (logistique, trafic, robotique).
    • Implémentation d’algorithmes collaboratifs state-of-the-art tels que CommNet et BiCNet, ainsi que de plusieurs baselines de référence, afin d’évaluer leur robustesse et leur efficacité dans des environnements multi-agents complexes.
    • Conception d’un banc d’essai réaliste basé sur une simulation de trafic routier autonome, permettant de comparer les performances en termes de coordination, de scalabilité et de temps de convergence.
    • Présentation des résultats et analyses lors d’une conférence interne, mettant en avant les implications pour la recherche appliquée en intelligence collective distribuée.

    Technologies : Ray RLlib, OpenAI Gym, PyTorch, TensorFlow, Docker, AWS (SageMaker, EC2)
    Mots-clés : MARL, reinforcement learning, multi-agent systems, CommNet, BiCNet, collaborative AI, simulation trafic, RLlib, Gym, AWS SageMaker, Docker, PyTorch, TensorFlow

Recommandations

Soyez le premier à recommander Hugo

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Software Engineering
    天津大学
    2021
    Software Engineering
  • Master of Science
    ESILV - Ecole Supérieure d'Ingénieurs Léonard de Vinci
    2021
    Master's degree, Data Sciences

Compétences (10)

Catégories