Description

90% des PoC IA meurent avant la prod.

Causes : architecture usine à gaz, coûts d'inférence (OpenAI/Gemini) explosifs, latence et zéro monitoring.

Ingénieur IA & Backend, je ne crée pas de prototypes jetables. Je reconstruis des pipelines LLM lents, coûteux ou instables pour les faire scaler en production.

J'accompagne les Startups & Scale-ups qui bloquent sur l'exécution technique et l'infra de leurs projets AI.

► MON APPROCHE :

La simplification. Je supprime les couches inutiles (ex: remplacer un RAG complexe + Redis par un pipeline asynchrone Kafka + Prompt Engineering solide). J'implémente un routing intelligent pour diviser vos coûts par 3 et un vrai LLMOps pour une observabilité totale.

► CE QUE JE METS EN PLACE (Stack & Expertise) :

Backend & Infra : Python, FastAPI, Pydantic v2, asyncio, Kafka, S3, PostgreSQL, Redis.
Ingénierie LLM : LangGraph, Function Calling, Schema-first JSON, Prompt Engineering, Routing multi-modèles (Gemini 2.5, OpenAI).
LLMOps & Monitoring : Tracking tokens/coûts, Rate-limiting, DLQ, Prometheus, Grafana.
Déploiement : Docker, Kubernetes (K8s), AWS (EKS, Bedrock), vLLM, RunPod, CI/CD.

► RÉSULTATS CONCRETS :

Pipeline d'extraction (Scale-up SOLV) : Remplacement d'un système instable par une archi Kafka minimaliste. 50k+ docs traités, 99.2% de succès, coûts d'API ÷3.
Clustering à contraintes IA : Conception d'un algo hybride scalable là où DBSCAN/K-Means échouaient sémantiquement.
Automatisation (Venio AI) : Plateforme d'agents livrée en prod via spec OpenAPI.

💡 "Exécution de niveau senior dès le premier jour — livraisons transverses sur le backend, le DevOps et l’ensemble du stack IA." — Luca F. (CTO, Venio AI)

► MODALITÉS :

• Full remote (Fuseau EU) | Missions 3-6 mois | Dispo immédiate.

On regarde sous le capot de votre infra LLM ? Contactez-moi.

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Espagnol
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

SOLV
Production LLM Engineer
octobre 2025 - Aujourd'hui (8 mois)
Bruxelles, Belgique
Scale-up belge de stakeholder analytics & risk management pour projets d'infrastructure complexes.

Pipeline d'extraction documentaire LLM :
Reconstruction complète d'un pipeline d'extraction instable (Redis + embeddings + RAG + modèles premium, crash à 10+ docs) par un système Kafka async minimaliste en Python/FastAPI.
→ 50 000+ documents traités, 99.2% succès, coût divisé par 3

Algorithme de clustering à contraintes :
Conception et implémentation d'un algorithme hybride : extraction de features par LLM (orientation, entités, nature) injectées comme pénalités dans la matrice de distance avant clustering hiérarchique. A résolu les limites de deux tentatives précédentes (DBSCAN, HDBSCAN+K-Means).

Routing multi-modèles & LLMOps :
Routing intelligent Gemini Flash ↔ Gemini 2.5 Pro (fallback OpenAI), sélection selon complexité/coût. Dashboards Prometheus/Grafana en production (p95 latence, coûts, densité d'extraction), rate-limiting, retries exp-backoff, DLQ.
LLM Python LLMOps RAG Langchain
Venio AI
AI Engineer
février 2025 - septembre 2025 (7 mois)
Reggio d'Émilie, Italie
Startup d'automatisation par agents IA pour entreprises non-tech.

Plateforme d'agents conversationnels :
Construction en Python/FastAPI d'une plateforme d'agents LLM : le système comprend le besoin utilisateur en langage naturel, génère un agent adapté et expose un endpoint API prêt à l'emploi. Génération automatique d'outils agents depuis specs OpenAPI.

Benchmarking & déploiement :
Suite de benchmarking (accuracy, coût, latence) pour comparer modèles LLM et prompts avant mise en production. Déploiements automatisés Docker/Kubernetes via GitLab CI/CD.
FastAPI Docker Python LLM Agent IA
ONECLICKHIRED
Fondateur
janvier 2025 - septembre 2025 (8 mois)
SaaS IA : parsing de CV + outreach personnalisé automatisé. Stack complète construite en solo : React/TS, Fastify, PostgreSQL, Redis/BullMQ, Stripe.

Intégration LLM multi-providers (Gemini + OpenAI), jobs asynchrones fiables. 150 inscriptions.
LLM PostgreSQL intelligence artificielle

Consulter toutes les expériences de Julien

Soyez le premier à recommander Julien

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Ingénieur, IA
EPITA
2025
Ingénieur, IA
MP
CPGE N.D. de Sion
2022
MP

Julien Cardi

Freelance IA | Expert LLM & RAG | Python · FastAPI

À propos de Julien

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences

Catégories