You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Thomas A.TA

Thomas A.

Senior Data Engineer

700 €/jour
Nantes, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Thomas

Fort d'une solide expertise en ingénierie des données et en technologies Big Data, je suis passionné par la création de solutions robustes et évolutives pour répondre aux défis les plus complexes en matière de gestion et d'analyse de données.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Nantes (jusqu’à 50 km)

Expériences

  • Crédit Agricole Technologies et Services
    Senior Data Engineer
    BANQUE & ASSURANCES
    juin 2024 - Aujourd'hui (2 ans)
    Nantes, France
    🚀 Modernisation du SI Crédit & Valorisation Extra-financière (DPE)

    Dans le cadre de cette mission pour le groupe Crédit Agricole, j'ai conçu et déployé des architectures data temps-réel et batch pour traiter des volumes massifs de données bancaires. Mon rôle a couvert l'ensemble du cycle de vie de la donnée, de l'ingestion CDC à l'analyse décisionnelle.

    🏗️ Réalisations clés
    Streaming & Ingestion Temps-Réel (CDC) : Mise en place d'une architecture de capture de données de changement (CDC) depuis des bases DB2 vers Kafka.

    Techniques : Optimisation des flux via des stratégies de Watermarking pour garantir la cohérence des jointures de données en temps réel.

    Qualité de Données & Géocodage : Développement d’une application de géocodage haute performance distribuée, traitant les adresses des 39 Caisses Régionales.

    Pipeline DPE & Valorisation Énergétique : Création d'un moteur d'ingestion mensuel traitant l'intégralité du portefeuille crédits.

    Impact : Croisement des données bancaires avec les DPE (Open Data ADEME & GED interne) via Spark pour enrichir le patrimoine de données avec des indicateurs de performance énergétique.

    Observabilité & Monitoring : Déploiement de dashboards de supervision via la Stack ELK pour assurer la haute disponibilité de la plateforme et le suivi des jobs critiques.

    💡 Expertise & Innovation : Apache Iceberg
    J'ai été force de proposition pour l'implémentation d'Apache Iceberg, apportant des gains majeurs sur :

    Historisation (Time Travel) : Capacité à interroger les états passés des données pour l'audit et le reporting réglementaire.

    Évolutivité du schéma : Gestion fluide des modifications de structure sans interruption des pipelines.

    Performance : Optimisation des requêtes grâce au partitionnement intelligent et à la réduction du scan de fichiers.

    🛠️ Environnement Technique
    Data : Spark (Streaming/Batch), Apache Kafka, Apache Iceberg.

    Cloud & Infra : Cloudera, AWS S3, Stack ELK.

    Méthodologie : Agile, CI/CD, Data Quality.
    Apache Spark Java Apache Airflow Apache Iceberg Apache Kafka
  • Natixis
    Senior Data Engineer
    BANQUE & ASSURANCES
    juin 2021 - mai 2024 (2 ans et 10 mois)
    Charenton-le-Pont, France
    🚀 Senior Data Engineer | Lead Technique - Migration Cloud & Flux Financiers (GCP)

    En tant que Senior Data Engineer au sein de la DataFactory de Natixis (Squad Flux), j'ai piloté la migration stratégique des flux de transactions financières (virements, monétique, chèques) vers Google Cloud Platform. Mon rôle a combiné leadership technique au sein d'une équipe internationale (14 personnes) et ingénierie de données complexe.

    🛠️ Leadership & Qualité
    Mentorat : Accompagnement de profils experts métier (Oracle) vers l'écosystème Spark/Scala.

    Standards de place : Garant des bonnes pratiques de développement, des revues de code et de la stratégie de tests unitaires.

    Collaboration : Coordination technique entre les équipes métiers, DataViz et développeurs (Paris/Porto).

    🏗️ Ingénierie de Données & Architecture "Low Code"
    Expertise sur le framework Starlake pour une gestion de l'ingestion basée sur la configuration (YAML) :

    Flux XML Critiques : Conception de pipelines d'ingestion complexes utilisant les XSD pour le typage dynamique.

    Sécurité (HSM) : Implémentation du chiffrement au niveau de la balise XML via des UDF Spark et parcours récursifs de schémas.

    Parsing avancé : Découpage et ventilation de fichiers financiers avec normalisation et gestion de la conformité.

    ⚡ Optimisation des Performances & Cloud
    Hybridation Spark/BigQuery : Migration stratégique des traitements lourds de Spark vers BigQuery pour exploiter la puissance native de GCP, divisant radicalement les temps de traitement sur les phases d'agrégation.

    Tuning Spark : Optimisation fine (gestion du cache, conversion RDD/DataFrame, optimisation des jointures).

    Orchestration : Pilotage des workflows via Airflow sur clusters éphémères Dataproc.

    🛠️ Environnement Technique
    GCP : BigQuery, Dataproc, Cloud Composer (Airflow), GCS.
    Data : Spark (Scala), SQL, Starlake (Framework Low Code), XSD/XML.
    Spark Scala Airflow Google Cloud Platform Terraform
  • Société Générale
    Tech Lead Big Data
    BANQUE & ASSURANCES
    avril 2019 - juin 2021 (2 ans et 3 mois)
    Fontenay-sous-Bois, France
    Contexte: Migration de calculs de métriques financières (risque de taux) développées avec Informatica/Oracle Exadata vers une plateforme Big Data (Spark/Scala).

    Tâches effectuées:
    • Développement des calculs de métriques financières (Sensi VAN/EVE, GAP de taux, MNI, risque de base)
    • Accompagnement de profils junior en reconversion
    • Application de bonnes pratiques de développement
    Spark Scala Hive Apache Nifi SQL

Recommandations

Soyez le premier à recommander Thomas

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master Systèmes et Applications Répartis
    Université Pierre et Marie Curie (Paris VI)
    2009
  • Licence Informatique
    Université Pierre et Marie Curie (Paris VI)
    2007

Certifications

Compétences

Catégories