Description

Vos données valent bien plus que ce que vous en faites aujourd'hui !

Fort de près de 10 années d'expérience, j'accompagne les équipes data, marketing et métier dans la construction de modèles prédictifs, leur industrialisation et l'exploitation concrète de leurs données.

J'ai eu la chance d'accompagner aussi bien des grands groupes (LVMH, Clarins, TF1, Fnac-Darty, HP, Janssen, TotalEnergies) que des PME et ETI en forte croissance.

🎯 DOMAINES D'EXPERTISE

📊 Analyse Exploratoire, Visualisation & Dashboarding

🧠 Data Science, Machine Learning & NLP

🤖 IA Générative

⚙️ Automatisation (RPA, workflows, document engineering)

🌐 Développement d'Applications Web

🛠️ STACK TECHNIQUE

📚 Machine Learning & NLP

Clustering et classification
Détection de sujets (topic modeling)
Analyse de sentiments
Prédiction de séries temporelles
Moteurs de recommandation
Détection d'anomalies

💻 Programmation

Python, Scala, PySpark, SQL, R

📦 Data Science & Librairies

Manipulation de données : Pandas, NumPy
Machine Learning : Scikit-Learn, XGBoost, LightGBM, MLLib
Deep Learning : Keras, PyTorch, TensorFlow
Graphes : NetworkX

🤖 IA Générative

Bases de données vectorielles : PostgreSQL (pgvector), Pinecone, Haystack
Frameworks : LangChain, LlamaIndex
API LLM : Claude (Anthropic), OpenAI, Cohere, Mistral, OVHcloud AI

☁️ Cloud

Google Cloud Platform : BigQuery, Vertex AI, Cloud Functions, Cloud Run
Azure : Azure ML, Azure Functions

🗄️ Bases de Données

Relationnelles : MySQL, PostgreSQL, SQLite, Hive
NoSQL : MongoDB
Graphes : Neo4j, Gremlin

📊 Visualisation

Plotly, Matplotlib, Seaborn, Tableau, Apache Superset

🕷️ Scraping & Collecte de Données

Requests, Selenium, BeautifulSoup, Scrapy

🌐 Développement Web & Prototypage

Front-end : React, HTML, CSS
Back-end / APIs : FastAPI, Flask
Reflex, Streamlit, Dash

🔧 DevOps & MLOps

Git, Docker, CI/CD
MLflow, monitoring de modèles

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Bilingue ou natif
Espagnol
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km), Lille (jusqu’à 50 km), Bordeaux (jusqu’à 50 km), Strasbourg (jusqu’à 50 km), Marseille (jusqu’à 50 km)

TotalEnergies
Lead Data Scientist
ENERGIE
janvier 2023 - Aujourd'hui (3 ans et 5 mois)
Paris, France
Prédiction des ventes :
Développé et déployé un modèle de prédiction (N-HiTS) sur GCP, améliorant la précision des forecasts de ~50%. Pipeline automatisé et interface de visualisation pour les équipes métier.

Clustering sémantique SEO :
Créé un algorithme regroupant +700k impressions Google par intention de recherche, permettant aux équipes SEO d'optimiser leur stratégie de contenu. Déployé via Streamlit sur GCP.

Monitoring des commentaires clients :
Mis en place un outil de topic modeling (BERTopic) analysant +10k commentaires pour identifier les tendances. Classification automatisée des nouveaux commentaires par proximité sémantique, avec labélisation par LLM (Gemini). Dashboard interactif pour le suivi.

Génération d'assets digitaux :
Développé une application web de création de visuels intégrant la génération d'images par IA (Gemini, Imagen) et un éditeur visuel. Temps de production réduit de plusieurs jours vs agence.
Google Cloud Platform (GCP) Python Clustering Développement Front-End Time Series
Johnson & Johnson
Customer Engagement Analytics Manager
INDUSTRIE PHARMACEUTIQUE
janvier 2022 - décembre 2022 (1 an)
Paris, France
Pilotage de l'adoption d'une plateforme de recommandation omnicanale
Interface entre équipes business et techniques pour aligner besoins métier et développements produit.
Accompagné 6 équipes dans le déploiement. Produit des rapports d'analytics identifiant les leviers d'engagement et augmentant l'adoption de la plateforme.
Python Gestion de projet Plotly Dash
Hewlett Packard Enterprise (HPE)
Data Engineer
EDITION DE LOGICIELS
septembre 2021 - janvier 2022 (4 mois)
Paris, France
Migration et industrialisation de pipelines data :
Migré les pipelines de R vers PySpark sur Dataiku.
Corrigé les failles du code legacy, renforçant la fiabilité de l'infrastructure.
PySpark Dataiku R Python

Consulter toutes les expériences de Raphael

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Bachelor of Science (BSc) en Système d’Information et Management
University College London
2016
Master of Science (MSc) en Data Science
King's College London
2018

Neural Networks and Deep Learning
Coursera
2019
https://www.coursera.org/account/accomplishments/verify/ULDNUDUQZUT8
Deep Learning Python
Mentor sur OpenClassrooms
OpenClassrooms
2018
Data science

Les certifications de Raphael sont accessibles uniquement aux membres Malt

Raphael Bensamoun

Data Scientist | NLP | AI & RAG Engineer

À propos de Raphael

Vos données valent bien plus que ce que vous en faites aujourd'hui !

🎯 DOMAINES D'EXPERTISE

🛠️ STACK TECHNIQUE

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories