You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Amelie MedemAM

Amelie Medem

Supermalter

Data engineer 🚀 - Experte data - Python Spark SQL

650 €/jour
5 projets
Paris, FR
8-15 ans

Délai de réponse moyen : 12h

À propos de Amelie

Bienvenue sur mon profil Malt 👋

J’interviens rĂ©guliĂšrement sur les missions de Data Engineer, Data science et dĂ©veloppement d'Application et : ✅

📒Data Engineer

Collecte des données via des sources variées (Site Web, API, Database) - Hadoop - Data Ingestion
Stockage des données dans des formats variés
Modélisation des données - Data Modeling
Création d'architectures de données efficaces - Data Architecture
Création et optimisation des performances des pipelines de données - Airflow - Data Pipeline
DĂ©veloppement et l’optimisation des traitements de donnĂ©es - Spark/PySpark/SQL - Data processing
Garantie de la qualité des données avec du suivi adéquat - Data qualité
Data Ops : gĂźt, Gitlab CI/CD, Jenkins
Mise à disposition des données aux équipes de Data Science

📒Data Science

Je peux collecter de la donnée brute, réaliser les analyses statistiques pour identifier les tendances sous-jacentes et les caractéristiques les plus pertinentes. Exposer les résultats des analyses dans des dashboards métiers - Tableau. Modéliser les besoins métiers par des algorithmes de machines learning (prédiction, recommandation, classification, clustering, ...), exposer les modÚles trouvés dans des API et mettre en production l'ensemble de la chaßne de prédiction (avec mises à jour en temps réel).

📒DĂ©veloppement d'API

API Django / Flask

📒Moteur de recherche

J'interviens dans toute la chaßne de la mise en place d'un moteur de recherche / De l'extraction de texte (Image, PDF,...), l'indexation, le regroupement en thématiques, jusqu'à la mise en service dans une plateforme Web.

🚀🚀🚀 Cette liste n'est pas exhaustive 🚀🚀🚀

Je propose des solutions utiles aux entreprises.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complÚte

En télétravail uniquement
Travaille majoritairement Ă  distance

Expériences

  • Vizcab
    Data ingénieur / Développeur
    EDITION DE LOGICIELS
    avril 2024 - Aujourd'hui (2 ans et 2 mois)
    Paris, France
    - Conçoit et développe de nouveaux pipelines de données dans Azure Databricks pour l'ingestion de données vers/depuis des applications produits, Azure Data Lake et des bases de données PostgreSQL.
    - Met en place des pipelines d'ingestion de métriques Datadog dans Databricks, associe ces données avec d'autres ensembles de données et expose des insights dans des rapports Power BI.
    - Crée et optimise des modÚles pour organiser et structurer les données issues de diverses applications et sources, afin de les rendre exploitables par les utilisateurs.
    - Développe et maintient des tableaux de bord Power BI et Databricks pour visualiser les informations, surveiller les performances des pipelines et garantir la qualité des données.
    - Améliore la qualité du code en appliquant les meilleures pratiques et en établissant des pipelines CI/CD robustes grùce à Databricks Bundle Assets, GitLab et SonarQube.
    - Implémente des tests unitaires et d'intégration.
    - DĂ©veloppe et met en Ɠuvre des contrats de donnĂ©es comme cadre pour surveiller les modĂšles de donnĂ©es et dĂ©finir des spĂ©cifications claires.
    - Collabore avec les équipes métiers pour identifier leurs besoins et fournir des solutions de données sur mesure qui apportent de la valeur.
    PySpark Databricks Microsoft PowerBI Gitlab CI/CD MySQL Modélisation des données Data contracts Extraire, transformer, charger (ETL) Data Pipeline Data Quality Data visualisation Microsoft Azure
  • Cour des comptes, Paris.
    Machine learning ingénieur / Project Lead
    SECTEUR PUBLIC & COLLECTIVITÉS
    décembre 2017 - août 2022 (4 ans et 8 mois)
    ● Conçoit et supervise l’architecture et le développement de la plateforme de recherche unifiée de la Cour des comptes basĂ©e sur un datalake Hadoop.
    ● Construit les pipelines de scrapping Python pour collecter des pages HTML des rapports produits par la Cour des comptes de 1870 à 2022 (180 k+).
    ● Crée et développe les projets Python pour extraire les textes bruts de 250 k+ rapports de types PDF, Word, HTML, Images documents (OCR), etc.
    ● Implémente des programmes Python pour nettoyer, traiter et structurer les données hétérogènes, et surtout identifier les connexions entre les données pour leur indexation (Elasticsearch) et leur analyse textuelle.
    ● Dirige et développe les pipelines Spark d’ingestion des contenus en provenance de diverses bases de données (ex: contrôles, référentiel des agents de la Cour, ...).
    ● Développe collaborativement la plateforme Web du moteur de recherche (React, Django).
    ● Réalise un POC NER (Reconnaissance d'Entités Nommées) pour extraire automatiquement les noms et expressions pertinentes dans le texte des rapports (Spacy, Deep learning).
    ● Organise et dirige les workshops d’annotation manuelle (Doccano) des rapports pour constituer une base d’apprentissage du POC NER propre au contexte de la Cour des comptes.
    ● Organise plusieurs ateliers utilisateurs pour collecter les besoins internes sur la recherche efficace de textes, l’organisation des documents et les liens logiques entre les informations.
    ● Travaille main à main avec l’UX designer pour la réalisation des mockups de la plateforme de
    recherche.
    Python Scala SQL PySpark Hadoop Elasticsearch Docker BeautifulSoup Tesseract Spacy Tika Pandas Numpy data ingenieur Modélisation statistique Python (Programming Language) Natural Language Processing (NLP) Python (Programming Language) Analyse des besoins Gestion de projet Project management Management d'équipe
  • SOLOCAL
    Data Ingénieur / Développeur Full Stack
    E-COMMERCE
    février 2016 - octobre 2018 (2 ans et 9 mois)
    Paris, France
    ● Développe à partir de zéro une application de data visualisation des professionnels de Page Jaunes. L’application fournit une vision 360° des professionnels (les produits souscrits, l'audience, la part de clics, les avis et les contenus payants et gratuits, ...).
    ● Refont et développe une application qui permet la visualisation géographique des audiences et activités des clients de Pages Jaunes (migration Java vers React+Node).
    ● Développe des pipelines Spark d’ingestion des données.
    ● Collecte, traite et charge les données dans les moteurs de recherche ElasticSearch.
    ● Écrire la documentation technique.
    ● Forme un étudiant dans le développement Web (3 mois).
    ● Forme un groupe de 10+ professionnels en Scala.
    Typescript Scala Hadoop Spark Apache Kafka Elasticsearch React.js PostgreSQL Python data ingenieur Analyse statistique GitHub

Recommandations

MJ
EC
Emmanuel BismuthEB
+1
Mariette Jusselme et 3 autres personnes recommandent Amelie

Ces profils de freelance correspondent également à vos critÚres

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Doctorat
    Université Pierre et Marie Curie - France
    2011
    Sujet: Méthodes automatiques pour la classification et la prédiction des pannes de réseaux

Certifications

Compétences

Catégories