Description

Ingénieure Data freelance, j’accompagne les entreprises dans la conception et l’automatisation de pipelines de données robustes et scalables, sur des architectures cloud modernes.

J’interviens sur l’ensemble du cycle de traitement des données :

— ingestion multi-sources (SQL, API, Excel) via Azure Data Factory / Databricks,

— orchestration de workflows complexes avec Power Automate / Airflow,

— traitement distribué avec Spark et Scala

— stockage dans des bases SQL (PostgreSQL, Oracle) et NoSQL (CosmosDB, MongoDB) selon les cas d’usage,

— visualisation métier via Power BI (modèles MCD, DAX, RLS, CLS...).

Je privilégie des workflows testés, versionnés, documentés, pour assurer la lisibilité et la maintenabilité sur le long terme.

🔧 Stack maîtrisée : Azure, Databricks, Spark, Scala, Data Factory, Python, SQL, Airflow, Power Automate, Power BI, Docker, Git, Hive, Hadoop

💡 Livraison de solutions prêtes à l’emploi, sécurisées, avec supervision intégrée (DAGs, alertes, dashboards)

📍 Basée à Paris ou International – disponible en remote ou hybride

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Allemand
Capacité professionnelle limitée
Polonais
Notions
Arabe
Capacité professionnelle limitée

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

Clasquin
Senior Data Engineer
LOGISTIQUE & SUPPLY CHAIN
septembre 2025 - Aujourd'hui (9 mois)
Lyon, France
Responsabilités
Mise en place de l'architecture Azure Databricks Lakehouse multi-environnements from scratch avec gestion de la sécurité: configuration du metastore, Service Principals, Key Vault, Secret Scopes et RBAC
Configuration de Unity Catalog avec external locations, credentials et gouvernance des données(droits, catalogs,schemas, volume)
Conception et déploiement d'une architecture Lakehouse Databricks structurée en médaillon Bronze → Silver → Gold
Développement de pipelines incrémentaux avec ingestion depuis Cosmos DB (Change Feed), APIs REST, bases SQL (connecteurs JDBC, clés SSH) le tout via PySpark et Lakeflow Declarative Pipelines,stockage dans le Delta Lake
Structuration du projet en packages Python versionnés pour standardiser les traitements ETL
Industrialisation destraitements via Databricks Asset Bundles et pipelines CI/CD Azure DevOps.
Optimisation des performances Spark : partitioning, OPTIMIZE, liquid clustering, incremental loading, Z-ordering, broadcast, caching
Mise en place de la data quality, monitoring, alerting, profiling, gestion du lineage et documentation technique
Développement de tests unitaires et d’intégration sur les pipelines PySpark pour garantir fiabilité destraitements en prod

Export de tables Delta vers Azure SQL Database pour consommation par les APIs C# métier
Développement de la couche Silver CRM (AAD Users, Matomo,soft-delete historization, MERGE UPSERT Delta, filtrage is_active, MCD )
Centralisation de l'ensemble des données opérationnelles de suivi des expéditions en temps réel
Livrables clés: 10+ sources intégrées, 20+ pipelines Delta Lake en production, 40+ tables analytiques Delta, framework ETL Python
réutilisable, environnement Azure sécurisé (Service Principals, Key Vault), CI/CD Azure DevOps opérationnels.
Environnement technique: Azure Databricks, PySpark, Delta Lake, Unity Catalog, Azure DevOps, Python, SQL, CosmosDB, Azure SQL
Database, Key Vault, Git
Azure DevOps Databricks Lakehouse unity cat Gitlab CI/CD
Fichorga
Data Engineer
DROIT
avril 2024 - juin 2025 (1 an et 2 mois)
Lille, France
Responsabilités:
Mise en place d'un environnement cloud complet : Azure Data Factory pour l'orchestration, Azure Blob Storage pour le stockage, Azure Synapse pour le traitement analytique
Application du principe de moindre privilège et politique RBAC sur les ressources Azure
Connexion à dessources variées: bases SQL, APIs métier, fichiers Excel via procédures stockées SQL pour la prépa et la transformation
Structuration des environnements dev /recette / production avec gestion fine des accès
Application de techniques de masquage, pseudonymisation et cryptage selon les cas d'usage (conformité RGPD)
Développement de pipelines Spark optimisés pour gérer de gros volumes avec délais de traitement courts (gain +50% sur les performances ETL)
Déploiement de DAGs Airflow assurant la planification quotidienne et l'automatisation complète des traitements, avec systèmes d'alerting pour le suivi opérationnel
Création de processus de build et déploiement intégrés Git + Docker
Gestion complète destests unitaires et d'intégration backend
Documentation technique complète: schémas, logs d'exécution,stratégie de rollback
Ateliers de recueil de besoins avec les équipes fonctionnelles (notaires, assistantes juridiques)
Développement de tableaux de bord Power BI personnalisés avec modélisation DAX avancée, filtres interactifs et sécurité RLS/CLS selon le profil utilisateur
Travail en méthodologie agile SAFe, participation active aux sprints et livraisons cadencées
Livrables clés: 6+ pipelines ETL réutilisables, robustes et sécurisés, DAGs Airflow monitorés avec alertes, tableaux de bord Power BI couvrant lesflux de données accessibles aux notaires.
Environnement technique: Azure (ADF, Blob, Synapse), Airflow, Spark, PostgreSQL, Python, SQL, T-SQL, Git, Docker, Power BI, Kubernetes, Jenkins
Microsoft Azure Spark PostgreSQL Transact-SQL Azure Data Factory
Orange
Data Engineer
TÉLÉCOMMUNICATIONS
septembre 2021 - septembre 2023 (2 ans)
Paris, France
Rattachée à la Direction des Systèmes d'Information d'Orange France au sein d'une équipe pluridisciplinaire (Data Analysts, Data Scientists).
Mission centrée sur la modernisation des outils de pilotage du trafic mobile à l'échelle nationale : solutions robustes, automatisées et
scalables.

Responsabilités
Création d'un workflow d'automatisation réduisant de 70% les tâches manuelles, avec composants testés, versionnés et alignés avec les bonnes pratiques
Migration de pipelines de trafic vers Databricks en s'appuyant sur Spark et la méthode Kimball pour améliorer la scalabilité, la traçabilité et la maintenabilité
Mise en place de scripts de collecte et de transformation sous Python, intégrés à Databricks
Indexation, pruning et partitioning pour l'amélioration des temps d’éxecution
Développement d'un modèle de prévision combinant ARIMA et régression linéaire pour anticiper les pics de trafic
Création de dashboards Power BI multi-niveaux pour les managers régionaux, RLS, rédaction d'un guide utilisateur
Application des bonnes pratiques de développement et suivi de qualité du code avec SonarQube
Intégration à Git pour le versioning (branches, pull requests, code review) et Jira pour le suivi Agile

Livrables clés: 5 pipelines en production, module de prévision ARIMA+régression linéaire, 3 dashboards Power BI multi-niveaux, guide utilisateur.
Environnement technique: Oracle, Databricks, Python (numpy, pandas,scikit-learn, tensorflow), Power BI, SonarQube, Git, Jira
Databricks Python PowerBI Git SonarQube

Soyez le premier à recommander Inès

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master 2 Big Data & Machine Learning
AGH University of Science and Technology
2023
Master 2 Big Data & Machine Learning
Master Big Data & Machine Learning
EFREI Paris
2022
Master Big Data & Machine Learning

Consultez la formation qu'a suivie Inès

Certification Microsoft : Fabric Analytics Engineer Associate
Microsoft
2024
https://learn.microsoft.com/fr-fr/users/inesmankour-0463/credentials/e8e5c1dd778a253c?ref=https%3A%2F%2Fwww.linkedin.com%2F
Azure Data Factory Datalake Microsoft Fabric PowerBI Data Warehouse Power BI Services DAX Spark Dataflow Modélisation

Cloud Engineer & Architect

Inès M.

Data Engineer – Azure, Spark, Airflow

À propos de Inès

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories