Bienvenue sur le profil Malt de Bezeid !
Localisation et déplacement
- Localisation
- Paris, France
- Peut travailler dans vos locaux à
-
- Paris et 50km autour
Préférences
- Durée de mission
-
Préfèrerait éviter:≤ 1 mois
- Taille d'entreprise
-
Préfèrerait éviter:1 personne
Vérifications
Charte du freelance Malt signée
Consulter la charte
Langues
Catégories
Compétences (29)
- Data Science
-
-
-
-
Bezeid en quelques mots
dans les technologies de traitement de la donnée (Python, R, GCP) et les modèles de machine
learning, deep learning et NLP.
Je dispose d’une forte expérience dans l’application des modèles de prédictions et
classifications et clustering dans différents domaines. Je dispose aussi de solides
compétences en visualisation de la donnée, notamment avec PowerBI, Tableau et Google Data Studio.
Expériences
ATOS - Marché UGAP INFOGÉRANCE - Atos Organisation
Secteur public & collectivités
Data Scientist -
*La poste : Analyse Automatique des enquêtes de satisfactions :
-- Extraction des réponses sur les enquêtes à partir de Survey Monkey et applications des règles métiers sur les réponses aux enquêtes.
-- Développement d’un pipeline de traitement pour la vectorisation des données Textuelles :
•• Nettoyage + Lemmatistaion
-- Développement de différentes approches NLP pour la classification des réponses au enquêtes :
•• TFIDF + Régression logistique
•• Word Embedding
•• Bert
-- Développement d’un algorithme NLP pour l’analyse de sentiment sur les réponses.
-- Mise en place d’un algorithme de topic modeling (LDA).
-- Automatisation de l’ingestion, l’inférence et l’entrainement des différents algorithme NLP sur GCP (Cloud function + Bigquery).
-- Dashbording et recherche textuelle interactive en utilisant Google Data Studio.
*Analyse des données démographiques et déploiements d’algorithme ML:
-- Extraction Traitements de données avec Power BI.
-- Déploiement d’algorithme de machine learning en utilisant FastAPI et
Docker.
ATOS - Atos Organisation
Conseil & audit
Data-Scientist
-- Scraping des pages d’accueil des sites Web des clients.
-- Mise en place d’une Pipeline d’algorithmes de nettoyage et traitement pour la
vectorisation des données Textuelles :
-Tfidf – Ngram – Word2vec
-- Mise en place d’algorithmes de machine Learning pour la classification du secteur
d’activité de chaque client :
- Régression Logistique
- Xgboost
- LSTM
*Green AI :
-- Benchmarking des outils de calcul de l’empreinte CO2, lors de l’entrainement
des algorithmes de machine Learning.
-- Mise en place d’une étude statistique comparative des empreintes CO2 de
différents algorithmes de classifications d’images.
-- Mise en place d’un pipeline pour la construction d’une Base d’apprentissage
pour l’entrainement des modèles de prédictions de L’empreinte CO2.
-- Mise en place d’un modèle de machine Learning pour la prédiction de
L’empreinte CO2.
ATOS - Atos Organisation
Conseil & audit
Data- Scientist
-- Etude de la qualité des données des remboursements anticipés (RPA).
-- Traitement et analyse statistique des données RPA.
-- Mise en place d’une Pipeline d’algorithme de machine Learning pour
l’anticipation des RPA.
-- Mise en place d’un d’algorithme de machine Learning pour la prédiction des
moments des RPA.
-- Explicabilité détaillées des résultats des algorithmes de machine Learning en
utilisant SHAP.
*Développement d’un outil de data mining pour répondre, à partir de la
littérature existante, aux questions scientifiques prioritaires sur le Covid19 :
-- Traitement des données Textuelles issu du corpus CORD 19, mise en place par
l’OMS et ces partenaires.
-- Mise en place d’un algorithme de machine Learning d’extraction des Keywords
et key sentences à partir des questions posées.
-- Mise en place d’un algorithme de NLP pour l’extraction des réponses les plus
pertinentes, à partir des documents du CORD19, aux questions posées.
Stade toulousain + Atos
Sport
Data-Scientist
-- Traitement, extraction et labélisation des données images à partir des
vidéos.
-- Traitement des données sémantiques et visuelles
-- Mise en place de plusieurs algorithmes de Deep Learning pour la détection
d’objets :
-- SDD
-- Retinanet
-- Mask R-CNN
-- Développement d’un Pipeline de détection de logos sur les vidéos de match
en utilisant les algorithmes entrainés précédemment.
*Développement du cognitive data center.
-- Traitement des données temporelles des logs serveurs.
-- Mise en place d’algorithme de machine Learning pour la prédiction des
pannes sur les serveurs :
- Linearregression
- Random Forest
-- Développement de tests unitaires.
-- Intégration des algorithmes dans le Pipeline de développement.
*Indexation Vidéo en utilisant les méthodes de Deep Learning (Challenge
Life-Log)
-- Traitement des données sémantique et visuelle.
-- Mise en place d’algorithme de Deep Learning pour la détection
d’objet.
-- Publication d’un working note des résultats obtenus et méthodes mise en
place
ATOS - Atos Organisation
Conseil & audit
Data-Scientist / Data-Analysis
-- Mise en place d’un Pipline d’extraction et de Nettoyage des données à partir
d’un cluster Hadoop.
-- Preprocessing et analyse des données de consommations de clients avec
Pyspark.
-- Mise en place d’un Dashboard, de visualisation, pour les indicateurs métiers de
consommations d’eau des clients.
-- Analyse et détection des cas de fraudes sur la consommation.
-- Mise en place d’un algorithme de classification supervisée pour la détection des
compteurs bloqués.
-- Explicabilité des résultats de l’algorithme de machine learning.
*Covea : Anticipation des pannes sur le site internet du GMF:
-- Corrélation des données client avec les données Google analytics.
-- Détection d’exfiltrations du site internet à l’aide de tests statistiques.
-- Mise en place d’une série d’algorithmes de classification supervisée pour la
détection des pannes.
-- Réalisation d’un Dashboard Tableau en temps réel pour la visualisation des
prédictions des pannes.
SUEZ - Suez
Energie
Data-Scientist: Projet Détection des compteurs d’eau bloqués (Sous comptage)
partir de Apach Hive.
-- Preprocessing et analyse des données de consommations de clients
avec Pyspark.
-- Mise en place d’un Dashboard, de visualisation, Tableau pour les
indicateurs métiers de consommations d’eau des clients.
-- Analyse et détection des cas de fraudes sur la consommation.
-- Mise en place d’un algorithme de classification supervisée pour la
détection des compteurs bloqués.
-- Explicabilité des résultats de l’algorithmie.
COVEA - Groupe Covea
Banque & assurances
Data-Scientist: Projet Anticipation des pannes sur le site internet du GMF
-- Détection d’exfiltrations du site internet à l’aide de tests statistiques.
-- Mise en place d’une série d’algorithmes de classification supervisée pour
la détection des pannes.
-- Réalisation d’un Dashboard Tableau en temps réel pour la visualisation
des prédictions des pannes.
Recommandations externes
Consultez les recommandations qu'a reçues Bezeid