Description

Fort d'une solide expertise en ingénierie des données et en technologies Big Data, je suis passionné par la création de solutions robustes et évolutives pour répondre aux défis les plus complexes en matière de gestion et d'analyse de données.

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Nantes (jusqu’à 50 km)

Crédit Agricole Technologies et Services
Senior Data Engineer
BANQUE & ASSURANCES
juin 2024 - Aujourd'hui (2 ans)
Nantes, France
🚀 Modernisation du SI Crédit & Valorisation Extra-financière (DPE)

Dans le cadre de cette mission pour le groupe Crédit Agricole, j'ai conçu et déployé des architectures data temps-réel et batch pour traiter des volumes massifs de données bancaires. Mon rôle a couvert l'ensemble du cycle de vie de la donnée, de l'ingestion CDC à l'analyse décisionnelle.

🏗️ Réalisations clés
Streaming & Ingestion Temps-Réel (CDC) : Mise en place d'une architecture de capture de données de changement (CDC) depuis des bases DB2 vers Kafka.

Techniques : Optimisation des flux via des stratégies de Watermarking pour garantir la cohérence des jointures de données en temps réel.

Qualité de Données & Géocodage : Développement d’une application de géocodage haute performance distribuée, traitant les adresses des 39 Caisses Régionales.

Pipeline DPE & Valorisation Énergétique : Création d'un moteur d'ingestion mensuel traitant l'intégralité du portefeuille crédits.

Impact : Croisement des données bancaires avec les DPE (Open Data ADEME & GED interne) via Spark pour enrichir le patrimoine de données avec des indicateurs de performance énergétique.

Observabilité & Monitoring : Déploiement de dashboards de supervision via la Stack ELK pour assurer la haute disponibilité de la plateforme et le suivi des jobs critiques.

💡 Expertise & Innovation : Apache Iceberg
J'ai été force de proposition pour l'implémentation d'Apache Iceberg, apportant des gains majeurs sur :

Historisation (Time Travel) : Capacité à interroger les états passés des données pour l'audit et le reporting réglementaire.

Évolutivité du schéma : Gestion fluide des modifications de structure sans interruption des pipelines.

Performance : Optimisation des requêtes grâce au partitionnement intelligent et à la réduction du scan de fichiers.

🛠️ Environnement Technique
Data : Spark (Streaming/Batch), Apache Kafka, Apache Iceberg.

Cloud & Infra : Cloudera, AWS S3, Stack ELK.

Méthodologie : Agile, CI/CD, Data Quality.
Apache Spark Java Apache Airflow Apache Iceberg Apache Kafka
Natixis
Senior Data Engineer
BANQUE & ASSURANCES
juin 2021 - mai 2024 (2 ans et 10 mois)
Charenton-le-Pont, France
🚀 Senior Data Engineer | Lead Technique - Migration Cloud & Flux Financiers (GCP)

En tant que Senior Data Engineer au sein de la DataFactory de Natixis (Squad Flux), j'ai piloté la migration stratégique des flux de transactions financières (virements, monétique, chèques) vers Google Cloud Platform. Mon rôle a combiné leadership technique au sein d'une équipe internationale (14 personnes) et ingénierie de données complexe.

🛠️ Leadership & Qualité
Mentorat : Accompagnement de profils experts métier (Oracle) vers l'écosystème Spark/Scala.

Standards de place : Garant des bonnes pratiques de développement, des revues de code et de la stratégie de tests unitaires.

Collaboration : Coordination technique entre les équipes métiers, DataViz et développeurs (Paris/Porto).

🏗️ Ingénierie de Données & Architecture "Low Code"
Expertise sur le framework Starlake pour une gestion de l'ingestion basée sur la configuration (YAML) :

Flux XML Critiques : Conception de pipelines d'ingestion complexes utilisant les XSD pour le typage dynamique.

Sécurité (HSM) : Implémentation du chiffrement au niveau de la balise XML via des UDF Spark et parcours récursifs de schémas.

Parsing avancé : Découpage et ventilation de fichiers financiers avec normalisation et gestion de la conformité.

⚡ Optimisation des Performances & Cloud
Hybridation Spark/BigQuery : Migration stratégique des traitements lourds de Spark vers BigQuery pour exploiter la puissance native de GCP, divisant radicalement les temps de traitement sur les phases d'agrégation.

Tuning Spark : Optimisation fine (gestion du cache, conversion RDD/DataFrame, optimisation des jointures).

Orchestration : Pilotage des workflows via Airflow sur clusters éphémères Dataproc.

🛠️ Environnement Technique
GCP : BigQuery, Dataproc, Cloud Composer (Airflow), GCS.
Data : Spark (Scala), SQL, Starlake (Framework Low Code), XSD/XML.
Spark Scala Airflow Google Cloud Platform Terraform
Société Générale
Tech Lead Big Data
BANQUE & ASSURANCES
avril 2019 - juin 2021 (2 ans et 3 mois)
Fontenay-sous-Bois, France
Contexte: Migration de calculs de métriques financières (risque de taux) développées avec Informatica/Oracle Exadata vers une plateforme Big Data (Spark/Scala).

Tâches effectuées:
Développement des calculs de métriques financières (Sensi VAN/EVE, GAP de taux, MNI, risque de base)
Accompagnement de profils junior en reconversion
Application de bonnes pratiques de développement
Spark Scala Hive Apache Nifi SQL

Consulter toutes les expériences de Thomas

Soyez le premier à recommander Thomas

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master Systèmes et Applications Répartis
Université Pierre et Marie Curie (Paris VI)
2009
Licence Informatique
Université Pierre et Marie Curie (Paris VI)
2007

Google Associate Cloud Engineer
Kryterion
2024
https://google.accredible.com/a7278996-32ec-4ec9-ad18-0403c772beb6
GKE Cloud Spanner BigQuery Cloud Logging Google Cloud Functions Cloud Monitoring Load Balancing Cloud SQL IAM Firestore Google Cloud Storage Google Compute Engine Google Cloud Run
Kafka
Confluent
2025
https://certificates.confluent.io/d893ae07-426e-4512-8bec-fc686a8216e5?key=2192593632d2c9a8b7e8b9db476659ead42ebba88b7517f70620e2d6aeb0779c#acc.UpO8jSJ7
KSQL Kafka Connect Apache Kafka Kafka Streams

Les certifications de Thomas sont accessibles uniquement aux membres Malt

Data Engineer

Cloud Engineer & Architect

Thomas A.

Senior Data Engineer

À propos de Thomas

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories