You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Inès M.IM

Inès M.

Data Engineer – Azure, Spark, Airflow

600 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Inès

Ingénieure Data freelance, j’accompagne les entreprises dans la conception et l’automatisation de pipelines de données robustes et scalables, sur des architectures cloud modernes.

J’interviens sur l’ensemble du cycle de traitement des données :
— ingestion multi-sources (SQL, API, Excel) via Azure Data Factory / Databricks,
— orchestration de workflows complexes avec Power Automate / Airflow,
— traitement distribué avec Spark et Scala
— stockage dans des bases SQL (PostgreSQL, Oracle) et NoSQL (CosmosDB, MongoDB) selon les cas d’usage,
— visualisation métier via Power BI (modèles MCD, DAX, RLS, CLS...).

Je privilégie des workflows testés, versionnés, documentés, pour assurer la lisibilité et la maintenabilité sur le long terme.

🔧 Stack maîtrisée : Azure, Databricks, Spark, Scala, Data Factory, Python, SQL, Airflow, Power Automate, Power BI, Docker, Git, Hive, Hadoop
💡 Livraison de solutions prêtes à l’emploi, sécurisées, avec supervision intégrée (DAGs, alertes, dashboards)
📍 Basée à Paris ou International – disponible en remote ou hybride
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

  • Allemand

    Capacité professionnelle limitée

  • Polonais

    Notions

  • Arabe

    Capacité professionnelle limitée

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Clasquin
    Senior Data Engineer
    LOGISTIQUE & SUPPLY CHAIN
    septembre 2025 - Aujourd'hui (9 mois)
    Lyon, France
    Responsabilités
    • Mise en place de l'architecture Azure Databricks Lakehouse multi-environnements from scratch avec gestion de la sécurité: configuration du metastore, Service Principals, Key Vault, Secret Scopes et RBAC
    • Configuration de Unity Catalog avec external locations, credentials et gouvernance des données(droits, catalogs,schemas, volume)
    • Conception et déploiement d'une architecture Lakehouse Databricks structurée en médaillon Bronze → Silver → Gold
    • Développement de pipelines incrémentaux avec ingestion depuis Cosmos DB (Change Feed), APIs REST, bases SQL (connecteurs JDBC, clés SSH) le tout via PySpark et Lakeflow Declarative Pipelines,stockage dans le Delta Lake
    • Structuration du projet en packages Python versionnés pour standardiser les traitements ETL
    • Industrialisation destraitements via Databricks Asset Bundles et pipelines CI/CD Azure DevOps.
    • Optimisation des performances Spark : partitioning, OPTIMIZE, liquid clustering, incremental loading, Z-ordering, broadcast, caching
    • Mise en place de la data quality, monitoring, alerting, profiling, gestion du lineage et documentation technique
    • Développement de tests unitaires et d’intégration sur les pipelines PySpark pour garantir fiabilité destraitements en prod

    • Export de tables Delta vers Azure SQL Database pour consommation par les APIs C# métier
    • Développement de la couche Silver CRM (AAD Users, Matomo,soft-delete historization, MERGE UPSERT Delta, filtrage is_active, MCD )
    • Centralisation de l'ensemble des données opérationnelles de suivi des expéditions en temps réel
    Livrables clés: 10+ sources intégrées, 20+ pipelines Delta Lake en production, 40+ tables analytiques Delta, framework ETL Python
    réutilisable, environnement Azure sécurisé (Service Principals, Key Vault), CI/CD Azure DevOps opérationnels.
    Environnement technique: Azure Databricks, PySpark, Delta Lake, Unity Catalog, Azure DevOps, Python, SQL, CosmosDB, Azure SQL
    Database, Key Vault, Git
    Azure DevOps Databricks Lakehouse unity cat Gitlab CI/CD
  • Fichorga
    Data Engineer
    DROIT
    avril 2024 - juin 2025 (1 an et 2 mois)
    Lille, France
    Responsabilités:
    • Mise en place d'un environnement cloud complet : Azure Data Factory pour l'orchestration, Azure Blob Storage pour le stockage, Azure Synapse pour le traitement analytique
    • Application du principe de moindre privilège et politique RBAC sur les ressources Azure
    • Connexion à dessources variées: bases SQL, APIs métier, fichiers Excel via procédures stockées SQL pour la prépa et la transformation
    • Structuration des environnements dev /recette / production avec gestion fine des accès
    • Application de techniques de masquage, pseudonymisation et cryptage selon les cas d'usage (conformité RGPD)
    • Développement de pipelines Spark optimisés pour gérer de gros volumes avec délais de traitement courts (gain +50% sur les performances ETL)
    • Déploiement de DAGs Airflow assurant la planification quotidienne et l'automatisation complète des traitements, avec systèmes d'alerting pour le suivi opérationnel
    • Création de processus de build et déploiement intégrés Git + Docker
    • Gestion complète destests unitaires et d'intégration backend
    • Documentation technique complète: schémas, logs d'exécution,stratégie de rollback
    • Ateliers de recueil de besoins avec les équipes fonctionnelles (notaires, assistantes juridiques)
    • Développement de tableaux de bord Power BI personnalisés avec modélisation DAX avancée, filtres interactifs et sécurité RLS/CLS selon le profil utilisateur
    • Travail en méthodologie agile SAFe, participation active aux sprints et livraisons cadencées
    Livrables clés: 6+ pipelines ETL réutilisables, robustes et sécurisés, DAGs Airflow monitorés avec alertes, tableaux de bord Power BI couvrant lesflux de données accessibles aux notaires.
    Environnement technique: Azure (ADF, Blob, Synapse), Airflow, Spark, PostgreSQL, Python, SQL, T-SQL, Git, Docker, Power BI, Kubernetes, Jenkins
    Microsoft Azure Spark PostgreSQL Transact-SQL Azure Data Factory
  • Orange
    Data Engineer
    TÉLÉCOMMUNICATIONS
    septembre 2021 - septembre 2023 (2 ans)
    Paris, France
    Rattachée à la Direction des Systèmes d'Information d'Orange France au sein d'une équipe pluridisciplinaire (Data Analysts, Data Scientists).
    Mission centrée sur la modernisation des outils de pilotage du trafic mobile à l'échelle nationale : solutions robustes, automatisées et
    scalables.

    Responsabilités
    • Création d'un workflow d'automatisation réduisant de 70% les tâches manuelles, avec composants testés, versionnés et alignés avec les bonnes pratiques
    • Migration de pipelines de trafic vers Databricks en s'appuyant sur Spark et la méthode Kimball pour améliorer la scalabilité, la traçabilité et la maintenabilité
    • Mise en place de scripts de collecte et de transformation sous Python, intégrés à Databricks
    • Indexation, pruning et partitioning pour l'amélioration des temps d’éxecution
    • Développement d'un modèle de prévision combinant ARIMA et régression linéaire pour anticiper les pics de trafic
    • Création de dashboards Power BI multi-niveaux pour les managers régionaux, RLS, rédaction d'un guide utilisateur
    • Application des bonnes pratiques de développement et suivi de qualité du code avec SonarQube
    • Intégration à Git pour le versioning (branches, pull requests, code review) et Jira pour le suivi Agile

    Livrables clés: 5 pipelines en production, module de prévision ARIMA+régression linéaire, 3 dashboards Power BI multi-niveaux, guide utilisateur.
    Environnement technique: Oracle, Databricks, Python (numpy, pandas,scikit-learn, tensorflow), Power BI, SonarQube, Git, Jira
    Databricks Python PowerBI Git SonarQube

Recommandations

Soyez le premier à recommander Inès

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master 2 Big Data & Machine Learning
    AGH University of Science and Technology
    2023
    Master 2 Big Data & Machine Learning
  • Master Big Data & Machine Learning
    EFREI Paris
    2022
    Master Big Data & Machine Learning

Certifications

Compétences

Catégories