You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Paul S.PS

Paul S.

Data Engineer - GCP/Python/DBT/Airflow

750 €/jour
Paris 7e Arrondissement, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Paul

Pourquoi Engager un Ancien Data Scientist devenu Expert en Data Engineering sur GCP ?

Les data scientists, dont j'ai fait partie, sont plongés dans le monde des mathématiques, mais la mise en production de leurs modèles requiert une expertise supplémentaire. En tant qu'ancien Data Scientist devenu Lead Data Engineer Python GCP, je suis parfaitement positionné pour comprendre les nuances des besoins de vos équipes data.

Mon Parcours Unique :

📊 De l'Expérimentation à la Production :

Ancré dans le monde de la Data Science, je comprends parfaitement les défis de passer de l'expérimentation à la production.

🛠️ De la Data Science à l'Ingénierie de Données :

Connaissant les lacunes entre la science des données et l'ingénierie, je suis dédié à transformer vos idées en produits concrets sur GCP.

🚀 Expertise Technique :

- Maîtrise de Python et expertise sur GCP pour des solutions data performantes.
- Conception et optimisation de solutions cloud native.
- Fort de plus de 2 ans d'expérience en tant qu'évaluateur en Python, bases de données et algorithmie, je suis prêt à mettre cette expérience au service de vos besoins en recrutement

🔧 Gestion du Cycle de Vie des Données :

- Industrialisation des pipelines avec Airflow et DBT.
- Déploiement de microservices Python basés sur l'IA.
- Gestion de l'opérationelle: git, CI/CD, Terraform, SRE


Prêt à échanger sur la manière dont mon parcours unique peut répondre précisément à vos besoins en matière d'ingénierie de données sur GCP ?
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

  • Espagnol

    Notions

Accepte de travailler sur site
Paris 7e Arrondissement (jusqu’à 30 km)

Expériences

  • S3NS ( GOOGLE X THALES)
    SRE DATA
    SÉCURITÉ CIVILE
    novembre 2023 - Aujourd'hui (2 ans et 7 mois)
    S3ns est une alliance entre Thales et Google, ayant pour volonté de proposer une offre « cloud de confiance » répondant aux critères du label SecNumCloud de l’ANSSI basée sur le code source de GCP publique. Au sein de l'équipe Analytique, le but est de pouvoir opérer en production les Service GCP afin de maintenir nos SLO, ainsi que de construire une stack d'analyse on prem sur des clusters Kubernetes.
    À ce titre, nous avons la chance de bénéficier des formations Interne de Google concernant les meilleures pratiques en SRE.
  • SFEIR
    Cloud agile data engineer
    E-COMMERCE
    février 2021 - Aujourd'hui (5 ans et 3 mois)
    Paris, France
    ⬥ GALEC Data Engineer GCP Juillet 2021 - Actuel

    Mise en place d’une plateforme de collecte des différents flux historiques de données.

    RÉALISATIONS

    - Développement au sein d’une squad (3 squads sur ce projet) de 16 dev et 11 Po d’un applicatif dockerizé gérant l’ingestion de fichier ( avro, csv, json, ascii, xml, protobuff) et de réponse d’api REST et gRPC vers Bigquery.
    - Gestion des modèles raw, bronze et silver sur Bigquery via dbt
    - Gestion de l’infrastructure via terraform
    - Test Unitaire avec dbt et Python
    - Orchestration via Airflow
    - Gestion et monitoring des processus (alerte en cas d’erreur) via dbt et prometeus

    ⬥ GROUPE LES ECHOS - LE PARISIEN Data Engineer GCP Mars 2021 - Juillet 2021

    Réalisation et évolution de plusieurs pipelines Data et mise en place de nouveaux reportings.

    RÉALISATIONS

    - Evolution et création de DAGs ( Batchs ) de récupération de données brutes et mise en place de pipelines ETL
    - Mise en place des nouveaux dashboarding en utilisant BigQuery pour aider au suivi d’ingestion
    - Cloud function scheduler, déployé via Terraform permettant l’ingestion de données d’une API (Batch).
    DBT GCP Airflow Python Docker BigQuery PubSub Terraform Azure DevOps
  • Carrefour
    Data scientist
    GRANDE DISTRIBUTION
    septembre 2019 - février 2021 (1 an et 5 mois)
    Massy, France
    Mise en place d'outils d'aide à la détection de fraude en utilisant des règles statiques ou des algorithmes de ML.

    RÉALISATIONS
    ⬥Purge d'un serveur de stockage contenant des pièces d'identités.
    Nécessitant du traitement d’image, de la reconnaissance faciale et de caractères. Programme en Python et Tensorflow, packager dans une Image Docker paramétrable.
    Mise en production via Jenkins / Kubernetes.
    Projet réalisé seul. (Sauf pour la partie Kubernetes)
    ⬥POC AutoML effectuant une labellisation automatique de fraude en magasin.
    ⬥Analyse de données et segmentation des clients physiques en implémentant des algorithmes effectuant des recherches sur des bases de données graphes.
    ⬥Rédaction de multiples requêtes SQL permettant de labellisé différents cas de fraudes.
    ⬥Administration du projet GCP
    GCP TensorFlow Bigquerry Docker Python TensorFlow Vertex AI Kubernetes

Recommandations

Soyez le premier à recommander Paul

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Data scientist (Bac +5)
    Central Supélec / Openclassrooms
    2020
    ● Collecte et préparation des données en vue de l’analyse. ● Programmation d’algorithmes de Machine Learning à l’aide du langage Python ● Déployer des algorithmes dans le cloud avec les outils du Big Data. ● Communiquer les résultats à des spécialistes ou des néophytes.
  • Licence Physique Chimie
    Université de perpignan
    2018

Certifications

Compétences

Catégories