You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Mathias GMG

Mathias G

Data Scientist spécialisé en NLP

550 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Mathias

Bonjour et bienvenue sur mon profil ! Ingénieur diplômé de Centrale Lyon et de Polytechnique Montréal avec une spécialisation en génie informatique, je cherche à mettre à disposition mes compétences techniques en machine learning et en gestion de projet.

Après deux stages en startup de recherche en machine learning (analyse de sentiments en NLP puis classification de boîtes de médicaments en computer vision avec un Conv AE de 95% d’accuracy sur 5000 boîtes, et intégration dans une application mobile), j’ai travaillé un an chez Sia Partners en tant que consultant data science. J’y ai développé des modèles d’extraction d’informations de documents textes, notamment à partir de modèles types Dense Passage Retriever et Question Answer.

Freelance depuis un an, je serai ravi de vous aider dans des missions d'implémentation et/ou de recherche de modèles de traitement de données. Je travaille notamment pour Zenlaw, une startup Legaltech américaine spécialisée en NLP. J’y ai développé un système de pipelines pour extraire des informations spécifiques à partir de documents juridiques, avec des modèles NLP (architecture transformer type BERT) et des fonctions de pré/post-processing. Ce système permet à Zenlaw de rapidement fournir des pipelines précises (> 90% accuracy) à ses clients en réutilisant efficacement les briques existantes.

Je travaille le plus souvent en Python, et utilise principalement Pytorch comme framework de machine learning, même si j’ai utilisé Tensorflow dans plusieurs projets. Dans mes projets personnels, j'ai par exemple développé un modèle de Super Resolution à base de GAN et de réseau de neurones convolutionnels, disponible sur mon GitHub .

Je suis sérieux, autonome, j’apprends vite et je suis à l'aise en équipe. Je saurai mener à bien vos projets de machine learning et de data science. N'hésitez pas à me contacter pour discuter de vos besoins et voir comment je peux vous aider à atteindre vos objectifs !
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

En télétravail uniquement
Travaille majoritairement à distance

Expériences

  • Zenlaw
    Data Scientist
    EDITION DE LOGICIELS
    juin 2022 - Aujourd'hui (4 ans)
    New York, États-Unis
    Développement de pipelines de NLP (modèles, pré-post processing fonctions) pour extraire des informations spécifiques (datapoints) depuis des documents légaux.
    • Développement de modèles pour des tâches de Question Answering, NER, classification de textes avec Spacy, Pytorch ou NLTK notamment.
    • Recherche de nouvelles techniques pour améliorer les performances des pipelines (GPT-JT, hyper parameter tuning, vectorisation, extraction de keywords)
    • Pipeline processing code : développement, création de la structure et maintenance du code (CICD).
    PyTorch Gestion de projet CI/CD Recherche et développement NLP Python
  • SIA PARTNERS
    Data Science Consultant
    CONSEIL & AUDIT
    avril 2021 - juin 2022 (1 an et 2 mois)
    Paris, France
    • R&D interne - Création d'une solution d’analyse de documents PDF multi langues à partir d'OCR et de modèles de NLP type BERT. Développement du backend de l'application.

    • Un des leaders mondiaux de la réassurance – Développement d’une plateforme de traitement et
    d’analyse automatisés de documents PDF à partir d’OCR et de NLP (question answering). Entrainement de modèles de Dense Passage Retriever et utilisation de méthodes alternatives.
    Gitlab Pytorch NLP Python SQL GCP
  • Meditect
    Computer Vision & Fraud detection - 6 months
    SANTÉ & BIEN-ÊTRE
    septembre 2020 - mars 2021 (6 mois)
    Paris, France
    Développement d’un algorithme de computer vision de classification du packaging des médicaments afin d’identifier les contrefaçons en Afrique de l'Ouest.
    • Création d’un dataset de boîtes de médicaments (versioning | cleaning | monitoring de la base de données)
    • Développement du modèle de classification (AutoEncoder Convolutionnel | Python | TensorFlow)
    • Intégration de la stack technique dans une application mobile (FireBase)
    Computer Vision TensorFlow Gitlab Python

Recommandations

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master of Science in Computer Science
    École Centrale de Lyon
    2020
    Master's degree, Computer Science
  • Double degree (Master's degree), GPA 4/4, Artificial Intelligence
    Polytechnique Montréal
    2020
    Double degree (Master's degree), GPA 4/4, Artificial Intelligence

Compétences (24)

Catégories