You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Maher NaijaMN

Maher Naija

Ingénieur IA | Fine-tuning LLM ·RAG ·Agents| MLOPS

850 €/jour
Châtillon, FR
15 ans et +

Délai de réponse moyen : 1h

À propos de Maher

Ingénieur IA avec 14+ ans d'expérience spécialisé en fine-tuning LLM à grande échelle et agents RAG en production, au service de 1 600+ utilisateurs enterprise.

Fine-tuning LLM : entraînement distribué sur 16 H200 GPUs avec FSDP, LoRA et HF Trainer — réduction des coûts de 3x vs. full fine-tuning. Inférence haute performance avec vLLM (100 tokens/s, 99% uptime).

RAG & Agents IA : pipelines multi-agents avec LangGraph et LangChain, APIs OpenAI/Anthropic, semantic search Qdrant — déployés en production enterprise pour 1 600+ utilisateurs.

MLOps end-to-end : Kubeflow, MLflow, Kubernetes (CKA certifié), CI/CD sur AWS. Time-to-production réduit de 50%.

Chez Dassault Systèmes Outscale : plateforme IA/ML complète de l'entraînement distribué (FSDP, PyTorch) à l'inférence en production. Expertise Big Data (Bouygues Telecom, Kafka/Spark) et réseaux (Qosmos, C). Fondateur de thejobbooster.cloud.
  • Anglais

    Bilingue ou natif

  • Français

    Bilingue ou natif

En télétravail uniquement
Travaille majoritairement à distance

Expériences

  • Dassault Systèmes Outscale
    AI Architect
    EDITION DE LOGICIELS
    décembre 2020 - Aujourd'hui (5 ans et 6 mois)
    Paris, France
    1. Machine Learning / AI Platform – Agentic AI
    • • Architected LLM fine-tuning to 16 H200 GPUs using LoRA and FSDP (Fully Sharded Data Parallel), cutting training cost 3x vs. full fine-tuning
    • • Architected production-grade LLM inference with vLLM on GPU clusters, serving 1,600 users at 99% uptime, 100 tokens/s throughput, and 3x perf improvement
    • • Mentored 7 ML/AI engineers to production-deploy models; established MLOps practices for model lifecycle management, monitoring, and reproducibility, re ducing time-to-production by 50%
    • • Led AI platform architecture, integrating open-source LLMs on GDPR-compliant sovereign cloud
    • • Designed a multi-agent RAG pipeline with LangGraph and LangChain, pro cessing 10,000+ enterprise documents
    PYTHON VLLM LANGGRAPH LANGCHAIN KUBERNETES MLFLOW RAG FSDP LORA PyTorch, LangFuse, Kubeflow, Qdrant, OpenTelemetry, Prometheus, MCP
    2. Accounting / Billing Platform: 7 platforms, multi-region/AZ
    • • Owned architecture and roadmap for 7 multi-region billing platforms (SLA, SLO, PRA) achieving 99.99% availability
    • • Implemented automated platform provisioning with Terraform and Ansible, reducing environment setup time from days to under 2 hours
    • • Built event-driven pipelines for real-time billing data processing, eliminating billing delays and reducing revenue reconciliation errors
    • • Cut billing software upgrade cycles from 1 week to 2 days with CI/CD
    TERRAFORM AWS KUBERNETES EKS GITLAB CI DOCKER EKS (Elastic Kuber netes
    vllm LLM LangGraph RAG FSDP
  • Bouygues Telecom
    Senior Data & Platform Engineer
    TÉLÉCOMMUNICATIONS
    janvier 2015 - décembre 2020 (5 ans et 11 mois)
    Paris, France
    1. Big Data / Data Lake Platform – National Fixed-Network Monitoring
    • • Designed and implemented data architecture for 9 device types, 3 million net work access devices, delivered a national supervision map enabling anomaly detection at scale
    • • Built ETL workflows processing 180 GB/day of telemetry data from 3 million network devices, feeding the national supervision map in real time
    • • Drove cross-functional deployment, delivering integrations 2 weeks ahead of schedule for a national-scale rollout to 3 million devices KAFKA
    MLflow Apache Kafka Kubernetes Apache Spark Airflow
  • Qosmos
    Software Engineer
    HIGH TECH
    septembre 2011 - décembre 2014 (3 ans et 3 mois)
    Paris, France
    1. as
    • • Achieved 10 Gbit/s throughput by developing and virtualizing the Deep Packet Inspection (DPI) engine for horizontal scalability
    • • Implemented and optimized network protocol parsers (RFC-compliant), con tributing to processing with sub-millisecond per-packet latency
    Python Linux Machine learning Pytorch

Recommandations

Soyez le premier à recommander Maher

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Certified Kubernetes Administrator (CKA)
    Linux Foundation
    2024
    Certified Kubernetes Administrator (CKA)
  • Master's Degree in Innovation Management
    ENSAM
    2013
    Master's Degree in Innovation Management

Certifications

  • Certified Kubernetes Administrator (CKA)
    Linux Foundation
    2024

Compétences

Catégories