You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Bakary S.BS

Bakary S.

AI/ML Engineer & MLOps Specialist

600 €/jour
Choisy-le-Roi, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Bakary

Senior LLMOps & MLOps Engineer (5+ ans) – Spécialisé en systèmes RAG et IA générative en production (AWS, GCP)

Je conçois et déploie des systèmes d’IA en production (RAG, LLMs, ML) pour des cas d’usage critiques, avec un focus sur la performance, la scalabilité et l’optimisation des coûts.

Expertise principale :
• Architecture RAG production-ready (hybrid search, reranking, vector DB : Qdrant, Pinecone)
• Industrialisation LLM (vLLM, déploiement GPU, APIs scalables)
• MLOps end-to-end (CI/CD, orchestration Prefect/Airflow, monitoring & drift)

Impact :
• Amélioration de la précision des systèmes de recherche sémantique
• Réduction de la latence et des coûts d’inférence LLM
• Mise en production de pipelines ML robustes et automatisés

Stack :
LLMOps : LangChain, LangGraph, vLLM, Hugging Face
Vector DB : Qdrant, Pinecone, FAISS
Cloud : AWS (SageMaker, S3, Lambda), GCP (Vertex AI)
Data/ML : PyTorch, XGBoost, PySpark

Disponible pour missions :
• RAG / IA générative
• MLOps / industrialisation ML
• Optimisation de systèmes LLM en production
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Choisy-le-Roi (jusqu’à 50 km)

Expériences

  • Base Claude Bernard
    Lead Data & IA
    octobre 2025 - Aujourd'hui (8 mois)
    Île-de-France, France
    • Conception et déploiement d’un système RAG médical en production (880k+ documents), améliorant la précision des réponses et garantissant la traçabilité (citations sourcées)

    • Mise en place d’un pipeline de retrieval multi-étapes :
    - Validation des requêtes via LLM (filtrage médical)
    - Expansion multi-requêtes (couverture sémantique)
    - Recherche hybride (Qdrant : dense BGE-M3 + sparse Splade + fusion)
    - Reranking via cross-encoder pour haute précision clinique

    • Industrialisation des LLM :
    - Déploiement vLLM (API OpenAI-like) sur GPU (RunAI)
    - Traitement asynchrone (Celery/Redis) → réduction de la latence

    • Mise en place d’une stack LLMOps en production :
    - CI/CD GitLab, conteneurisation Docker, monitoring
    - Fiabilité, reproductibilité et optimisation des coûts

    • Développement de pipelines data incrémentaux (Prefect) :
    - Ingestion multi-sources (ANSM, HAS…)
    - Versioning intelligent (hash) → réduction des recalculs

    Stack : Qdrant, vLLM, LangChain, Prefect, FastAPI, Docker, GitLab CI/CD, PostgreSQL
  • Lisi
    Data & MLOps Engineer
    CONSEIL & AUDIT
    novembre 2022 - Aujourd'hui (3 ans et 7 mois)
    Paris, France
    • • Développement de pipelines MLOps end-to-end sur AWS SageMaker :
    - CI/CD GitLab, déploiement automatisé, model registry
    - Monitoring du drift avec alertes → amélioration de la robustesse

    • Conception de pipelines data scalables :
    - ETL (AWS Glue, PySpark), orchestration (Airflow)
    - Data Lake S3 + analytics (Athena)

    • Développement d’APIs et sécurisation des accès :
    - AWS Lambda + API Gateway
    - Gestion des utilisateurs via Cognito

    • Mise en place d’un système RAG industriel :
    - Recherche sémantique sur documentation technique
    - Observabilité (LangSmith) : latence, coûts, hallucinations

    Stack : AWS (SageMaker, Glue, Airflow, Lambda, S3), LangChain, OpenSearch, PySpark
    Cloud AWS MLOps / Machine Learning Engineering AWS SageMaker GenAI RAG
  • TradeIn
    Data Scientist
    avril 2021 - octobre 2022 (1 an et 6 mois)
    Paris, France
    ️ Stack : AWS (S3, Textract, QuickSight, SageMaker, Lambda, Athena), Airflow, FastAPI, XGBoost, PostgreSQL, PySpark

Recommandations

Soyez le premier à recommander Bakary

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master of Science
    École Polytechnique
    2020
    Master 2, Data Science
  • Master 2 (M2), Multimedia Networking
    Télécom ParisTech
    2019
    Master 2 (M2), Multimedia Networking

Certifications

Compétences (20)

Catégories