Bienvenue sur le profil Malt de Neroma !

Malt vous permet d'accéder aux meilleurs consultants freelances pour vos projets. Contactez Neroma pour échanger sur votre besoin ou recherchez d'autres profils sur Malt.

Neroma Kossi

data scientist, statisticien économiste

Peut se déplacer à Paris

  • 48.85661400000001
  • 2.3522219000000177
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Neroma.
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Neroma.

Localisation et déplacement

Localisation
Paris, France
Peut travailler dans vos locaux à
  • Paris et 50km autour

Préférences

Durée de mission
  • ≤ 1 semaine
  • ≤ 1 mois
  • entre 1 et 3 mois
  • entre 3 et 6 mois

Vérifications

Influence

Kaggle

Kaggle : kkiller kkiller
  • Master Tier
  • 241 Rang
  • 5 Bronze
  • 4 Argent
  • 1 Or

Langues

Catégories

Compétences (26)

  • Débutant Intermédiaire Confirmé
  • NLP
    Débutant Intermédiaire Confirmé
  • Frameworks
  • Débutant Intermédiaire Confirmé
  • Débutant Intermédiaire Confirmé

Neroma en quelques mots

Grand amoureux de la Data Science et ayant un goût prononcé pour tout ce qui relève de la mathématique ou de la programmation informatique, j'aime faire parler les données. Et justement, les données, hier encore résidus peu valorisés de l’entreprise, se révèlent aujourd'hui indispensables par leur capacité à générer, au grand dam de tous, de la valeur concrète et bénéfique à tout organisme soucieux de son développement et de l'optimisation de ses process.

Expériences

Caisse des dépots

Banque & assurances

Extraction d'informations clés des rapports de diagnostics de performance électrique pour faciliter la validation des demandes d'éco-prêts

Paris, France

septembre 2020 - Aujourd'hui

Dans le cadre de ses activités de prêt, la CDC accompagne ses clients dans leurs plans de rénovation, à travers notamment l’éco-prêt. Pour pouvoir bénéficier de ce produit, il faut justifier des gains énergétiques suffisamment importants après travaux. Pour ce faire, des audits sont effectués par des partenaires agréés.

Pour répondre à une demande d’éco-prêt, les analystes CDC ont aujourd’hui pour tâche de récupérer manuellement certaines informations sur les documents telles que les consommations avant/après travaux, l’adresse, la surface, le bailleur social, l’émission de gaz à effet de serre …

Afin de faire gagner du temps aux analystes, CDC souhaite automatiser l’analyse de ces diagnostics de performance énergétique (DPE) à travers l’usage de méthodes d'intelligence artificielle et des algorithmes de machine & deep learning.
Plusieurs variables devront être ainsi automatiquement récupérées :

• Adresse
• Date du diagnostic
• Consommation avant rénovation
• Scénario consommation post rénovation
• Emission avant rénovation
• Scénario émission post rénovation
• Surface
• Bailleur social - sur la base de 500 CDC habitats


L’ensemble de la solution a été développé en utilisant le langage de programmation Python et son écosystème. Le modèle a été entraîné sur le cloud de Azure. Des outils open-source et gratuits comme Tesseract, Xpdf, PdfMiner, ImageMagick, GhostScript et LabelImg nous ont été très utiles dans la conversion des PDFs en de formats intelligibles par les algorithmes de machine & deep learning.

Agence Française de Développement

Banque & assurances

Analyse de données textuelles pour le positionnement des banques de développement par rapport aux ODD

Paris, France

juillet 2020 - septembre 2020

Il s'agit d'utiliser les techniques de NLP pour comprendre et analyser les rapports annuels de diverses banques de développement afin d'en détecter l'importance respective de chacun des 17 ODD fixés par les nations unies. Cette mission a été menée en tant que consultant Data Scientist chez l'Agence Française de Développement (AFD).

Les résultats plutôt satisfaisants obtenus prouvent que l'intelligence artificielle reste un levier très prometteur qui peut permettre aux institutions de se donner un avantage concurrentiel quasi certain.

Institut de Radioprotection et de la Sûreté Nucléaire (IRSN)

Energie

Extraction, catégorisation et journalisation automatiques des rapports PDFs d'incidents

Paris, France

mars 2020 - juillet 2020

Il s'agit de passer la machine de reconnaissance optique de caractère (OCR en anglais) sur des milliers de PDFs représentant des rapport d'incident afin de déduire les thématiques abordées et de les catégoriser en de différentes classes métier.

Application du Tesseract après conversion des PDFS en images (ImageMagick, baguette)
Reconstruction des lignes de texte par regroupement.
Extraction du résumé par classification (ingénierie des caractéristiques par page).
Récupération des sous-parties pertinentes (via une seconde classification au niveau de la ligne) du document par positionnement avec les sous-titres cibles.
Correction orthographique du texte par modélisation linguistique (RNN, LSTM, Transformers).
Assistance à l'utilisateur dans l'utilisation de l'API OCR.
Documentation technique et fonctionnelle

TF1 SA - Groupe TF1

Presse & médias

Recommandation de vidéo par machines de Boltzman

Paris, France

avril 2019 - septembre 2019

Recommandations externes

Consultez les recommandations qu'a reçues Neroma

Formations