Bienvenue sur le profil Malt de Asma !
Localisation et déplacement
- Localisation
- Paris, France
- Télétravail
- Effectue ses missions majoritairement à distance
Vérifications
Charte du freelance Malt signée
Consulter la charte
Langues
Catégories
Compétences (29)
- BigData
-
-
- Data Science
-
Asma en quelques mots
Mes compétences incluent l'industrialisation et la mise en prod des modèles Data science, orchestration des jobs, alimentation des datalabs (ETL), Analyse des données, visualisation (BI), optimisation (scripts, consommation ressources en RAM et CPU), administration des plateformes, mise en place des modèles data science, support pour l'équipe data
Je peux intervenir sur des missions de collecte, transfert, stockage, analyse et exploitation de données.
Expériences
GLANUM (Client LIVEPOOL)
Agence & SSII
Data Engineer - En tant que freelance
Consommation des données afin de les sauvegarder dans un topic Kafka (Akka, kafka stream, kafdrop) en scala.
- Parsing des messages (transformation et restructuration des données en format Json) / scala.
- Consommation des données kafka afin de les envoyer sur un bucket S3 AWS / scala.
- Récupération et agrégation des données depuis S3 (boto3 / python).
ITCE
Banque & assurances
Data Engineer
- Configuration des serveurs applicatifs des différents envs (Dev, recette, Prod).
- Migration et montée de version d'HADOOP (tests et configurations des environnements de travail).
- Configuration des paramètres Spark (Allocation dynamique des ressources).
- Outillage : tester des nouveaux outils et faire des présentations aux différents
utilisateurs de la plateforme (jupytext, Pylint, mlflow, DVC,..).
- Alimentation du Datalake des envs hors prod.
- Faire du support pour les Data scientists.
HSBC France
Banque & assurances
Alternante Big Data
Environnement : HADOOP distribution Hortonworks, Analyse des données avec Hive, prétraitements et Apprentissage sous Jupyter (Python) et R. Administration de la platforme HADOOP (Hortonworks).
Détection des anomalies (outliers) transactions frauduleuses. Anonysation sous HADOOP, Visualisation, dans un premier temps, sous Dataiku. Dans un second temps, partir sur un POC full GCP (Google Cloud Platform) : Analyse des données avec Big Query, Prétraitement et Apprentissage sous Cloud ML engine (Python), ETL Dataflow, Visualisation : Data Studio.
Recommandations externes
Consultez les recommandations qu'a reçues Asma