Parcourir les profils Déposer un projet
Malt welcom

Bienvenue sur le profil Malt de Usama !

Malt vous permet d'accéder aux meilleurs consultants freelances pour vos projets. Contactez Usama pour échanger sur votre besoin ou recherchez d'autres profils sur Malt.

Usama Shah

data engineer / ops

Peut se déplacer à Les Mureaux, Paris

  • 48.988008
  • 1.913246
Proposer une mission La mission ne démarrera que si vous acceptez le devis de Usama.
Proposer une mission La mission ne démarrera que si vous acceptez le devis de Usama.

Localisation et déplacement

Localisation
Les Mureaux, France
Peut travailler dans vos locaux à
  • Les Mureaux et 50km autour
  • Paris et 30km autour

Préférences

Durée de mission
≥ 6 mois
Secteur d'activité
Préfèrerait :
  • Commerce de détail
  • E-commerce
  • Edition de logiciels
  • Energie
  • Grande distribution
+5 autres
Préfèrerait éviter:
  • Banque & assurances
  • Défense & armée
  • Vins & Spiritueux
  • Agence & SSII

Vérifications

Charte du freelance Malt signée
Consulter la charte

E-mail vérifié

Langues

Catégories

Compétences (24)

Usama en quelques mots

L'un des plus grands défis actuels est de savoir comment traiter correctement les données qui nous entourent.
Mon parcours professionnel m'a permis de combiner des connaissances en software engineering et des capacités d'analyse de données. Cela m'a également permis, au fil des ans, de contribuer au développement de divers pipelines IA pour de grandes entreprises dans les domaines de l'énergie et de la finance.

Expériences

Crédit Agricole SA - Groupe Crédit Agricole

Banque & assurances

Data Engineer / MLOps Engineer  - En tant que freelance

Montrouge, France

octobre 2021 - Aujourd'hui (1 an et 5 mois)

Contexte:
Mettre en oeuvre des solutions pour aider les data scientists à déployer des modèles ML distribués en production.

Missions:
- Développement de code élégant et simple pour des architectures et des applications performantes, fiables et maintenables.
- Développement, packaging et déploiement de la solution interne d’AutoML distribuée avec Spark/H2O.aio
- Conception et développement d’un template PySpark qui permet d’automatiser le packaging des dépendances et le déploiement des jobs Spark sur des plateformes HDP isolées avec (Shell/PEX (cluster pack)/Gitlab CI/CD)
- Mise en place et maintenance des chaînes CI/CD (Gitlab CI)
- Mise en place de tests continus, automatisés (unitaire, d'intégration, de non régression et de charge) et de coverage.
- Migration des assets de production Spark 2.2 -> 2.4, HDP -> CDP
- Débogage et optimisations des jobs Spark dans HDP
- Développement dans un environnement agile
Python PySpark Gitlab CI Docker Hadoop Pandas API UNIX

BNP PARIBAS - BNP

Banque & assurances

Data Scientist / Engineer  - En tant que freelance

Paris, France

septembre 2018 - septembre 2021 (3 ans)

Contexte:
Assurer une R&D activable en Data Science et IA :
-Rechercher, tester et valider l'apport d'approches innovantes (NLP, Computer Vision, Speech Recognition, Boosting) sur des problématiques métiers Data Driven (détection de la fraude, recherche sémantique, scores d'appétence, efficacité opérationnelle, interprétation de modèles)
-Contribuer le cas échéant à mettre en production des solutions adéquates répondant à ces problématiques grâce à la plateforme interne d'industrialisation en production de projets Python intégrant des principes BizOps et des capacités d'exposition étendues : Batch, Streaming, API, Webapp

Missions
- Développement de code élégant et simple pour des architectures et des applications performantes, fiables et maintenables.
- Mise en place et maintenance de la chaîne CI/CD
- Mise en place de test et de coverage sur l’ensemble de l’architecture logicielle
- Mise en production et run de pipeline machine learning en Python
- Monitoring des modèles en production avec des webapp (streamlit/dash)
- Entraînement et déploiement en production d'un modèle de détection d'usurpation d'identité dans le cadre de la lutte contre la fraude:
-> Extraction et transformation d'environ 700 Gb de données avec PySpark
-> Inférence en moins de 500 ms avec un modèle type boosting
-> Inférence en streaming (1 million d'events par jour)
- Mise en production d'un modèle de détection de fraude chèque:
-> Conversion d'un code SQL en Python pour pouvoir inférer en quasi temps réel (batch vers micro batch processing)
- Optimisation : conception d'un solveur python (solution interne) permettant de résoudre un programme d'optimisation sous un grand nombre de contraintes non linéaires dans le cadre de sollicitations marketing
- Extraction, manipulation, valorisation & visualisation d'un grand volume de données (> 700 gb)

Boursorama - Société Générale

Banque & assurances

Data Scientist / Engineer

Boulogne-Billancourt, France

septembre 2017 - septembre 2018 (1 an)

Contexte:

Activités de Data Science et Data engineering au sein du DataLab de Boursorama, j'ai participé à la mise en place, l'évolution et la maintenance :
- d'une plateforme Data Lake-de l'alimentation du Data Lake
- de plusieurs projets (Détection de fraudes, normalisation des logs du SI, prédiction des futurs meilleurs clients)

Missions:
- Création et industrialisation d'un système de recommandation de produits financiers en utilisant le collaborative filtering en Spark/Scala et MLlib
- Détection de fraude dans les demandes de crédit personnel (MLlib, Scala)
- Scoring des moments de vie des clients pour la détection de fraude en Scala (régression linéaire)
- Normalisation des logs du SI
- Extraction, manipulation, valorisation & visualisation d'un grand volume de données (Spark/Scala/Hadoop/SQL/Tableau/Python)

Recommandations externes

Consultez les recommandations qu'a reçues Usama