You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Raphael BensamounRB

Raphael Bensamoun

Data Scientist | NLP | AI & RAG Engineer

600 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Raphael

Vos données valent bien plus que ce que vous en faites aujourd'hui !

Fort de près de 10 années d'expérience, j'accompagne les équipes data, marketing et métier dans la construction de modèles prédictifs, leur industrialisation et l'exploitation concrète de leurs données.

J'ai eu la chance d'accompagner aussi bien des grands groupes (LVMH, Clarins, TF1, Fnac-Darty, HP, Janssen, TotalEnergies) que des PME et ETI en forte croissance.

🎯 DOMAINES D'EXPERTISE

📊 Analyse Exploratoire, Visualisation & Dashboarding
🧠 Data Science, Machine Learning & NLP
🤖 IA Générative
⚙️ Automatisation (RPA, workflows, document engineering)
🌐 Développement d'Applications Web

🛠️ STACK TECHNIQUE

📚 Machine Learning & NLP
  • Clustering et classification
  • Détection de sujets (topic modeling)
  • Analyse de sentiments
  • Prédiction de séries temporelles
  • Moteurs de recommandation
  • Détection d'anomalies
💻 Programmation
  • Python, Scala, PySpark, SQL, R
📦 Data Science & Librairies
  • Manipulation de données : Pandas, NumPy
  • Machine Learning : Scikit-Learn, XGBoost, LightGBM, MLLib
  • Deep Learning : Keras, PyTorch, TensorFlow
  • Graphes : NetworkX
🤖 IA Générative
  • Bases de données vectorielles : PostgreSQL (pgvector), Pinecone, Haystack
  • Frameworks : LangChain, LlamaIndex
  • API LLM : Claude (Anthropic), OpenAI, Cohere, Mistral, OVHcloud AI
☁️ Cloud
  • Google Cloud Platform : BigQuery, Vertex AI, Cloud Functions, Cloud Run
  • Azure : Azure ML, Azure Functions
🗄️ Bases de Données
  • Relationnelles : MySQL, PostgreSQL, SQLite, Hive
  • NoSQL : MongoDB
  • Graphes : Neo4j, Gremlin
📊 Visualisation
  • Plotly, Matplotlib, Seaborn, Tableau, Apache Superset
🕷️ Scraping & Collecte de Données
  • Requests, Selenium, BeautifulSoup, Scrapy
🌐 Développement Web & Prototypage
  • Front-end : React, HTML, CSS
  • Back-end / APIs : FastAPI, Flask
  • Reflex, Streamlit, Dash
🔧 DevOps & MLOps
  • Git, Docker, CI/CD
  • MLflow, monitoring de modèles
  • Français

    Bilingue ou natif

  • Anglais

    Bilingue ou natif

  • Espagnol

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km), Lille (jusqu’à 50 km), Bordeaux (jusqu’à 50 km), Strasbourg (jusqu’à 50 km), Marseille (jusqu’à 50 km)

Expériences

  • TotalEnergies
    Lead Data Scientist
    ENERGIE
    janvier 2023 - Aujourd'hui (3 ans et 5 mois)
    Paris, France
    Prédiction des ventes :
    Développé et déployé un modèle de prédiction (N-HiTS) sur GCP, améliorant la précision des forecasts de ~50%. Pipeline automatisé et interface de visualisation pour les équipes métier.

    Clustering sémantique SEO :
    Créé un algorithme regroupant +700k impressions Google par intention de recherche, permettant aux équipes SEO d'optimiser leur stratégie de contenu. Déployé via Streamlit sur GCP.

    Monitoring des commentaires clients :
    Mis en place un outil de topic modeling (BERTopic) analysant +10k commentaires pour identifier les tendances. Classification automatisée des nouveaux commentaires par proximité sémantique, avec labélisation par LLM (Gemini). Dashboard interactif pour le suivi.

    Génération d'assets digitaux :
    Développé une application web de création de visuels intégrant la génération d'images par IA (Gemini, Imagen) et un éditeur visuel. Temps de production réduit de plusieurs jours vs agence.
    Google Cloud Platform (GCP) Python Clustering Développement Front-End Time Series
  • Johnson & Johnson
    Customer Engagement Analytics Manager
    INDUSTRIE PHARMACEUTIQUE
    janvier 2022 - décembre 2022 (1 an)
    Paris, France
    Pilotage de l'adoption d'une plateforme de recommandation omnicanale
    Interface entre équipes business et techniques pour aligner besoins métier et développements produit.
    Accompagné 6 équipes dans le déploiement. Produit des rapports d'analytics identifiant les leviers d'engagement et augmentant l'adoption de la plateforme.
    Python Gestion de projet Plotly Dash
  • Hewlett Packard Enterprise (HPE)
    Data Engineer
    EDITION DE LOGICIELS
    septembre 2021 - janvier 2022 (4 mois)
    Paris, France
    Migration et industrialisation de pipelines data :
    Migré les pipelines de R vers PySpark sur Dataiku.
    Corrigé les failles du code legacy, renforçant la fiabilité de l'infrastructure.
    PySpark Dataiku R Python

Recommandations

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Bachelor of Science (BSc) en Système d’Information et Management
    University College London
    2016
  • Master of Science (MSc) en Data Science
    King's College London
    2018

Certifications

Compétences

Catégories