À propos de Raphael
Vos données valent bien plus que ce que vous en faites aujourd'hui !
🎯 DOMAINES D'EXPERTISE
🛠️ STACK TECHNIQUE
- Clustering et classification
- Détection de sujets (topic modeling)
- Analyse de sentiments
- Prédiction de séries temporelles
- Moteurs de recommandation
- Détection d'anomalies
- Python, Scala, PySpark, SQL, R
- Manipulation de données : Pandas, NumPy
- Machine Learning : Scikit-Learn, XGBoost, LightGBM, MLLib
- Deep Learning : Keras, PyTorch, TensorFlow
- Graphes : NetworkX
- Bases de données vectorielles : PostgreSQL (pgvector), Pinecone, Haystack
- Frameworks : LangChain, LlamaIndex
- API LLM : Claude (Anthropic), OpenAI, Cohere, Mistral, OVHcloud AI
- Google Cloud Platform : BigQuery, Vertex AI, Cloud Functions, Cloud Run
- Azure : Azure ML, Azure Functions
- Relationnelles : MySQL, PostgreSQL, SQLite, Hive
- NoSQL : MongoDB
- Graphes : Neo4j, Gremlin
- Plotly, Matplotlib, Seaborn, Tableau, Apache Superset
- Requests, Selenium, BeautifulSoup, Scrapy
- Front-end : React, HTML, CSS
- Back-end / APIs : FastAPI, Flask
- Reflex, Streamlit, Dash
- Git, Docker, CI/CD
- MLflow, monitoring de modèles
Français
Bilingue ou natif
Anglais
Bilingue ou natif
Espagnol
Capacité professionnelle complète
Expériences
- TotalEnergiesLead Data ScientistENERGIEjanvier 2023 - Aujourd'hui (3 ans et 5 mois)Paris, FrancePrédiction des ventes :Développé et déployé un modèle de prédiction (N-HiTS) sur GCP, améliorant la précision des forecasts de ~50%. Pipeline automatisé et interface de visualisation pour les équipes métier.Clustering sémantique SEO :Créé un algorithme regroupant +700k impressions Google par intention de recherche, permettant aux équipes SEO d'optimiser leur stratégie de contenu. Déployé via Streamlit sur GCP.Monitoring des commentaires clients :Mis en place un outil de topic modeling (BERTopic) analysant +10k commentaires pour identifier les tendances. Classification automatisée des nouveaux commentaires par proximité sémantique, avec labélisation par LLM (Gemini). Dashboard interactif pour le suivi.Génération d'assets digitaux :Développé une application web de création de visuels intégrant la génération d'images par IA (Gemini, Imagen) et un éditeur visuel. Temps de production réduit de plusieurs jours vs agence.
- Johnson & JohnsonCustomer Engagement Analytics ManagerINDUSTRIE PHARMACEUTIQUEjanvier 2022 - décembre 2022 (1 an)Paris, FrancePilotage de l'adoption d'une plateforme de recommandation omnicanaleInterface entre équipes business et techniques pour aligner besoins métier et développements produit.Accompagné 6 équipes dans le déploiement. Produit des rapports d'analytics identifiant les leviers d'engagement et augmentant l'adoption de la plateforme.
- Hewlett Packard Enterprise (HPE)Data EngineerEDITION DE LOGICIELSseptembre 2021 - janvier 2022 (4 mois)Paris, FranceMigration et industrialisation de pipelines data :Migré les pipelines de R vers PySpark sur Dataiku.Corrigé les failles du code legacy, renforçant la fiabilité de l'infrastructure.
Recommandations
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Bachelor of Science (BSc) en Système d’Information et ManagementUniversity College London2016
- Master of Science (MSc) en Data ScienceKing's College London2018
Certifications
- Neural Networks and Deep LearningCoursera2019
- Mentor sur OpenClassroomsOpenClassrooms2018