You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Habib HerbiHH

Habib Herbi

Freelance Big Data Engineer & Cloud

550 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Habib

Ingénieur Big Data et Cloud avec 6 ans d'expérience, titulaire d'un certificat Analyse Big Data avec Spark et Scala/Python, certificat AZURE Databricks et expérience en Cloud (AZURE, AWS).
6 ans d'expérience dans le développement Spark, Data Ingestion et tranformation, Pipelines ETL, le streaming, les bases de données et Data Warehouses.
  • Français

    Bilingue ou natif

  • Anglais

    Bilingue ou natif

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Groupement Les Mousquetaires - Stime
    Data Engineer / Azure Cloud
    AGROALIMENTAIRE
    février 2024 - Aujourd'hui (2 ans et 4 mois)
    Paris, France
    Azure / Spark Data Engeneer: Developping ETLs with Spark using Delta Lake technology from Databricks
    Using Databricks SQL Analytics for Data warehousing
    Using:
    Databricks, Data Factory ADF, Synaps, ADLS, Azure DEVOPS, Repos, Pieplines, CICI
    Spark, Spark SQL, DataFrames, Scala, Python, ADLS, Azure Data Factory, Azure databricks, Azure DevOps, Azure Pipelines, Delta Lake, Lake House, Scrum, PowerBI, CICD

    Skills: Databricks SQL Analytics - Delta lake - Spark 3 - Microsoft Azure

    - Setting up a Maven solution
    - Use of Prototype Classes (OOP) for maximum code optimization
    - Code modularization
    - Intervention on several cross-functional projects
    - Propose architectures and guide the choice of technologies adapted to needs
    - Development of a Generative AI solution with databricks using GPT4
    - Identify, collect, explore, understand and integrate the data necessary to resolve problematics
    - Development of the Spark/Scala solution on InteleJ with Maven – unit testing – git copilot
    - Development on Azure Databricks + Data Factory
    - Maintenance and provisioning of the Maven solution (dependencies, build, plugins, etc.)
    - CICD with Azure Repos, DevOps and Pipelines

    - Sonar Qube integration with Azure DevOps


    - Migrating to Unity Catalog

    - Azure Cost Optimization (FinOps)
  • AXADirectAssurance
    Ingénieur Big Data / Cloud
    mars 2022 - janvier 2023 (10 mois)
    migrer un ETL dit legacy sur SQL Serveur vers le Cloud Azure. Nous avons utilisé la technologie Delta Lake de Databricks pour bénéficier des avantages du Lake House. L'équipe et aussi responsable de la mise en production, de l'intégration continue, et de la gestion du processus DevOps. La mission consistait à :
    • Proposer des architectures et orienter le choix des technologies adaptées aux besoins de différents projets Data
    • Collaborer avec les experts métier pour comprendre les problématiques métier et opérationnelles
    • Identifier, collecter, explorer, comprendre et intégrer les données nécessaires à la résolution de ses problématiques
    • Développement, monitoring et scheduling des pipelines Azure Data Factory
    • Développement des tests unitaires avec Scala Test
    • Développement sur Azure Databricks + Data Factory
    • Scheduling des jobs avec ADF
    • CICD avec azure Repos, DevOps et Pipelines
    • Monitoring de la Prod, PreProd, investigation en cas de bug 1 Test de qualité en comparant avec la source SQL Serveur
    • Débogage sur Databricks
    • Participer et participer à des Rétrospectives afin d'améliorer le rendement de l'équipe
    • Proposer des architectures et orienter le choix des technologies adaptées aux besoins de différents projets Data : Data Model, pipeline ETL
    • Collaborer avec les PO et les clients pour comprendre les problématiques métier
    • Participer, avec l'équipe, au développement de la plateforme sur Azure et à la définition des bonnes pratiques de développement
    • Caching et Persisting Z-ordering, Data Skipping Build et deploy pipelines - optimisation des couts azure (FinOps) - live delta tables - Unity Catalog
    Outils : Spark, Spark SQL, DataFrames, Scala, Python, ADLS, Azure Data Factory, Azure databricks, Azure DevOps, Azure Pipelines, Delta Lake, Lake House, Scrum, PowerBI, CICD, Azure Repos, , SQL Server, IntelliJIDE - maven - sbt - Delta Live Tables - Unity Catalog - FinOps
  • Societe Generale
    Big Data Engineer
    septembre 2019 - février 2022 (2 ans et 6 mois)
    Paris Area, France
    Pyspark Data Engineer handling the Full big data stack : data ingestion, data transformation, data warehousing, data analytics. Also, data streaming, data visualization, Spark optimization and high performance job optimization and managing high requirement data workloads. Using: Spark Scala - PySpark - Python - Hadoop - Cloud - Hive - SparkML - SQL, noSQL, Kafka, oozie, rest api, Structured streaming, delta lake, databricks, Machine Learning , aws , spark optimization , kibana , scrum master, swagger, project management, azure databricks, hdfs, S3, spark , cluster configuration. Tableau software,Git, Kibana, Ansible, Grafana.

Recommandations

Soyez le premier à recommander Habib

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master's degree
    Sorbonne Université
    2018
    ISSI Master , proposed by the UPMC University - Paris This Master's Program provides knowledge and experience in image/audio processing for smart systems including Deep and Machine learning. These are the Labs supporting the Program: * L'Institut des Systèmes Intelligents et de Robotique (ISIR, UPMC, INSERM, CNRS) * L'Institut de La vision (IDV, CNRS, INSERM, UPMC) * UMR sciences et technologie de la musique et du son (STMS, IRCAM, UPMC)
  • Master's degree
    Paris-Sud University (Paris XI)
    2017
    Master 1 E3A at Paris-Sud Paris This Master's program prepares students to a more advanced studies in electronics, computer science, image processing and machine learning

Certifications

  • azure databricks
    databricks
    2021
  • databricks deltalake
    databricks
    2021

Compétences

Catégories