You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Julien CardiJC

Julien Cardi

Freelance IA | Expert LLM & RAG | Python · FastAPI

500 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Julien

90% des PoC IA meurent avant la prod.
Causes : architecture usine à gaz, coûts d'inférence (OpenAI/Gemini) explosifs, latence et zéro monitoring.


Ingénieur IA & Backend, je ne crée pas de prototypes jetables. Je reconstruis des pipelines LLM lents, coûteux ou instables pour les faire scaler en production.


J'accompagne les Startups & Scale-ups qui bloquent sur l'exécution technique et l'infra de leurs projets AI.


► MON APPROCHE :
La simplification. Je supprime les couches inutiles (ex: remplacer un RAG complexe + Redis par un pipeline asynchrone Kafka + Prompt Engineering solide). J'implémente un routing intelligent pour diviser vos coûts par 3 et un vrai LLMOps pour une observabilité totale.


► CE QUE JE METS EN PLACE (Stack & Expertise) :
  • Backend & Infra : Python, FastAPI, Pydantic v2, asyncio, Kafka, S3, PostgreSQL, Redis.
  • Ingénierie LLM : LangGraph, Function Calling, Schema-first JSON, Prompt Engineering, Routing multi-modèles (Gemini 2.5, OpenAI).
  • LLMOps & Monitoring : Tracking tokens/coûts, Rate-limiting, DLQ, Prometheus, Grafana.
  • Déploiement : Docker, Kubernetes (K8s), AWS (EKS, Bedrock), vLLM, RunPod, CI/CD.
► RÉSULTATS CONCRETS :
  • Pipeline d'extraction (Scale-up SOLV) : Remplacement d'un système instable par une archi Kafka minimaliste. 50k+ docs traités, 99.2% de succès, coûts d'API ÷3.
  • Clustering à contraintes IA : Conception d'un algo hybride scalable là où DBSCAN/K-Means échouaient sémantiquement.
  • Automatisation (Venio AI) : Plateforme d'agents livrée en prod via spec OpenAPI.

💡 "Exécution de niveau senior dès le premier jour — livraisons transverses sur le backend, le DevOps et l’ensemble du stack IA." — Luca F. (CTO, Venio AI)


► MODALITÉS :
• Full remote (Fuseau EU) | Missions 3-6 mois | Dispo immédiate.


On regarde sous le capot de votre infra LLM ? Contactez-moi.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

  • Espagnol

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • SOLV
    Production LLM Engineer
    octobre 2025 - Aujourd'hui (8 mois)
    Bruxelles, Belgique
    Scale-up belge de stakeholder analytics & risk management pour projets d'infrastructure complexes.


    Pipeline d'extraction documentaire LLM :
    Reconstruction complète d'un pipeline d'extraction instable (Redis + embeddings + RAG + modèles premium, crash à 10+ docs) par un système Kafka async minimaliste en Python/FastAPI.
    → 50 000+ documents traités, 99.2% succès, coût divisé par 3


    Algorithme de clustering à contraintes :
    Conception et implémentation d'un algorithme hybride : extraction de features par LLM (orientation, entités, nature) injectées comme pénalités dans la matrice de distance avant clustering hiérarchique. A résolu les limites de deux tentatives précédentes (DBSCAN, HDBSCAN+K-Means).


    Routing multi-modèles & LLMOps :
    Routing intelligent Gemini Flash ↔ Gemini 2.5 Pro (fallback OpenAI), sélection selon complexité/coût. Dashboards Prometheus/Grafana en production (p95 latence, coûts, densité d'extraction), rate-limiting, retries exp-backoff, DLQ.
    LLM Python LLMOps RAG Langchain
  • Venio AI
    AI Engineer
    février 2025 - septembre 2025 (7 mois)
    Reggio d'Émilie, Italie
    Startup d'automatisation par agents IA pour entreprises non-tech.


    Plateforme d'agents conversationnels :
    Construction en Python/FastAPI d'une plateforme d'agents LLM : le système comprend le besoin utilisateur en langage naturel, génère un agent adapté et expose un endpoint API prêt à l'emploi. Génération automatique d'outils agents depuis specs OpenAPI.


    Benchmarking & déploiement :
    Suite de benchmarking (accuracy, coût, latence) pour comparer modèles LLM et prompts avant mise en production. Déploiements automatisés Docker/Kubernetes via GitLab CI/CD.
    FastAPI Docker Python LLM Agent IA
  • ONECLICKHIRED
    Fondateur
    janvier 2025 - septembre 2025 (8 mois)
    SaaS IA : parsing de CV + outreach personnalisé automatisé. Stack complète construite en solo : React/TS, Fastify, PostgreSQL, Redis/BullMQ, Stripe.


    Intégration LLM multi-providers (Gemini + OpenAI), jobs asynchrones fiables. 150 inscriptions.
    LLM PostgreSQL intelligence artificielle

Recommandations

Soyez le premier à recommander Julien

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Ingénieur, IA
    EPITA
    2025
    Ingénieur, IA
  • MP
    CPGE N.D. de Sion
    2022
    MP

Compétences

Catégories