Bienvenue sur le profil Malt de Thibaut !
Localisation et déplacement
- Localisation
- Lyon, France
- Peut travailler dans vos locaux à
-
- Lyon et 50km autour
- Paris et 100km autour
- Genève et 100km autour
Préférences
- Durée de mission
-
Préfèrerait éviter:
- ≤ 1 semaine
- ≤ 1 mois
Vérifications
Charte du freelance Malt signée
Consulter la charte
Langues
Catégories
Compétences (20)
- Data Science
-
Débutant Intermédiaire Confirmé
-
Débutant Intermédiaire Confirmé
-
Débutant Intermédiaire Confirmé
-
Débutant Intermédiaire Confirmé
-
Débutant Intermédiaire Confirmé
-
Débutant Intermédiaire Confirmé
- Tous
-
Débutant Intermédiaire Confirmé
-
Débutant Intermédiaire Confirmé
Thibaut en quelques mots
Vous recherchez une personne qui comprend votre projet et s'implique pleinement pour le développer?
Vous êtes sur la bonne page.
Data scientist avec un background en ingénierie et en business, j'accompagne des clients de tous types de secteurs sur des sujets de Deep Learning ou de Machine Learning.
Passionné par l'IA et la programmation, je recherche constamment de nouveaux challenges et je serais ravi de pouvoir vous aider à concrétiser une idée ou accompagner votre équipe.
❏ 𝗠𝗲𝘀 𝗰𝗼𝗺𝗽𝗲́𝘁𝗲𝗻𝗰𝗲𝘀
Langages: Python 3, Unix Shell
frameworks ML/DL: PyTorch, Tensorflow2, Keras, Scikit-Learn, TensorBoard
Numpy, Pandas, dask
data visualisation: Matplotlib, Seaborn, plotly, bokeh
Base de données: SQL, postgresql
Base de données NoSQL : mongoDB
Déploiement: Docker
Cloud: AWS (Amazon Web Services), GCP (Google Cloud Platform), Scaleway
Versioning: Git, DVC
IDE/Debugging: VisualStudio
Deep Learning, Machine Learning
NLP, Computer Vision
Réseaux de neurones
Gestion de projets, Leadership, communication
Expériences
Worldwide IT consulting company
Agence & SSII
Data Scientist
- optimisation de l’algorithme (amélioration du preprocessing: Regex, NLTK)
- introduction de multiprocessing (acceleration >x8 sur les traitements à complexité importante)
- MLOps, développement de la pipeline CI/CD sous gitlab-CI
- R&D pour amélioration des calculs de similarités (réseaux siamois,cosine similarity, auto-encoders)
- Évolution de l’infrastructure Azure (kubernetes, Azure functions)
Thibaut Martin
Agence & SSII
Data Scientist - En tant que freelance
Résumé du portfolio (plus de détails sur les rubriques suivantes):
➡ Développement de modèles Traitement Automatique du Langage Naturel (TALN/NLP) pour une start-up innovante du domaine de la santé. Classification de commentaires en multi-label (~30 labels).
➡ Développement de modèles prédictifs de cours financier pour un marché financier intégré à un jeu vidéo connu. Prédiction de séries temporelles sur un marché avec plus de 4000 items et des milliards d'ordres.
➡ Développement d'un classificateur d'e-mail pour alléger les tâches du standard en détectant le contenu des emails. Classification multi-class (~5 labels avec spams)
➡ Modèles prédictifs de crypto-monnaies (LSTM) Tools: Tensorflow, sklearn, numpy, pandas
Start-up Santé
Secteur médical
Data Scientist - Mission NLP - En tant que freelance
- EDA: clustering pour identifier les labels, ré-échantillonnage des données, rapports statistique avec visualisation de données, suggestions de roadmap
- Implémentation de baseline (Logistic Regression avec TF-IDF) classification
- Implémentation de transformers (BERT - flauBERT) fine tuned pour multi label, pour répondre à des critères de performances > 95% (recall - precision - accuracy)
Outils: PyTorch, Tensorflow, sklearn, gensim, NLTK, spacy, pandas, numpy, seaborn regex Cloud: Scaleway pour instance GPU et stockage S3
ESN
Agence & SSII
Data Scientist - Mission Modèles prédictifs/Série temporelles
- EDA sur la base de donnée postgres (~100 tables) avec postgresql et psycopg2
- Développement d'algorithmes de scraping pour télécharger des données de marché supplémentaires (~1 milliard d'ordre par année), aggrégation des données avant entrainement
- POC de différentes approches de prédictions de série temporelles (FB prophet etc..)
- Preprocessing des données, nettoyage de valeurs abbérantes, feature engineering pour équilibrer les poids des variables, visualisation des poids.
- Développement d'une application conteneurisé sur AWS pour tracker des données supplémentaires, (instance EC2 et execution Fargate)
Outils: XGBoost, Tensorflow, sklearn pandas, numpy, seaborn database: postgresql deployment: Docker Cloud: AzureDevops (Versionning, project) and AWS (EC2/fargate)
Client B2C
Immobilier
Mission Freelance - NLP
- Mise en route d'un système d'étiquetage open source pour labéliser les données
- EDA sur les données bruts
- Nettoyage des données, segmentation des mails
- Preprocessing et entrainement de premiers modèles pour une V1 (Regression Logistic sur les classes "simples" ou RNN sur les classes plus complexes)
Tools: Tensorflow, sklearn NLTK, spacy regex pandas, numpy seaborn, wordcloud
Up Technologies
Agence & SSII
Business Manager
M IMMOBILIER
Immobilier
Manager
‣ Gestion des travaux de rénovation et des prestataires, entretien des relations avec les propriétaires
COLAS - Colas
Conducteur de travaux junior
Gruppo TecnoElettra
Ingénieur stagiaire Recherche & Développement
Recommandations externes
Consultez les recommandations qu'a reçues Thibaut