Description

Ingénieur Big Data et Cloud avec 6 ans d'expérience, titulaire d'un certificat Analyse Big Data avec Spark et Scala/Python, certificat AZURE Databricks et expérience en Cloud (AZURE, AWS).

6 ans d'expérience dans le développement Spark, Data Ingestion et tranformation, Pipelines ETL, le streaming, les bases de données et Data Warehouses.

Domaines d’expertise

Langues

Français
Bilingue ou natif
Anglais
Bilingue ou natif

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

Groupement Les Mousquetaires - Stime
Data Engineer / Azure Cloud
AGROALIMENTAIRE
février 2024 - Aujourd'hui (2 ans et 4 mois)
Paris, France
Azure / Spark Data Engeneer: Developping ETLs with Spark using Delta Lake technology from Databricks
Using Databricks SQL Analytics for Data warehousing
Using:
Databricks, Data Factory ADF, Synaps, ADLS, Azure DEVOPS, Repos, Pieplines, CICI
Spark, Spark SQL, DataFrames, Scala, Python, ADLS, Azure Data Factory, Azure databricks, Azure DevOps, Azure Pipelines, Delta Lake, Lake House, Scrum, PowerBI, CICD

Skills: Databricks SQL Analytics - Delta lake - Spark 3 - Microsoft Azure

- Setting up a Maven solution
- Use of Prototype Classes (OOP) for maximum code optimization
- Code modularization
- Intervention on several cross-functional projects
- Propose architectures and guide the choice of technologies adapted to needs
- Development of a Generative AI solution with databricks using GPT4
- Identify, collect, explore, understand and integrate the data necessary to resolve problematics
- Development of the Spark/Scala solution on InteleJ with Maven – unit testing – git copilot
- Development on Azure Databricks + Data Factory
- Maintenance and provisioning of the Maven solution (dependencies, build, plugins, etc.)
- CICD with Azure Repos, DevOps and Pipelines

- Sonar Qube integration with Azure DevOps

- Migrating to Unity Catalog

- Azure Cost Optimization (FinOps)
AXADirectAssurance
Ingénieur Big Data / Cloud
mars 2022 - janvier 2023 (10 mois)
migrer un ETL dit legacy sur SQL Serveur vers le Cloud Azure. Nous avons utilisé la technologie Delta Lake de Databricks pour bénéficier des avantages du Lake House. L'équipe et aussi responsable de la mise en production, de l'intégration continue, et de la gestion du processus DevOps. La mission consistait à :
• Proposer des architectures et orienter le choix des technologies adaptées aux besoins de différents projets Data
• Collaborer avec les experts métier pour comprendre les problématiques métier et opérationnelles
• Identifier, collecter, explorer, comprendre et intégrer les données nécessaires à la résolution de ses problématiques
• Développement, monitoring et scheduling des pipelines Azure Data Factory
• Développement des tests unitaires avec Scala Test
• Développement sur Azure Databricks + Data Factory
• Scheduling des jobs avec ADF
• CICD avec azure Repos, DevOps et Pipelines
• Monitoring de la Prod, PreProd, investigation en cas de bug 1 Test de qualité en comparant avec la source SQL Serveur
• Débogage sur Databricks
• Participer et participer à des Rétrospectives afin d'améliorer le rendement de l'équipe
• Proposer des architectures et orienter le choix des technologies adaptées aux besoins de différents projets Data : Data Model, pipeline ETL
• Collaborer avec les PO et les clients pour comprendre les problématiques métier
• Participer, avec l'équipe, au développement de la plateforme sur Azure et à la définition des bonnes pratiques de développement
• Caching et Persisting Z-ordering, Data Skipping Build et deploy pipelines - optimisation des couts azure (FinOps) - live delta tables - Unity Catalog
Outils : Spark, Spark SQL, DataFrames, Scala, Python, ADLS, Azure Data Factory, Azure databricks, Azure DevOps, Azure Pipelines, Delta Lake, Lake House, Scrum, PowerBI, CICD, Azure Repos, , SQL Server, IntelliJIDE - maven - sbt - Delta Live Tables - Unity Catalog - FinOps
Societe Generale
Big Data Engineer
septembre 2019 - février 2022 (2 ans et 6 mois)
Paris Area, France
Pyspark Data Engineer handling the Full big data stack : data ingestion, data transformation, data warehousing, data analytics. Also, data streaming, data visualization, Spark optimization and high performance job optimization and managing high requirement data workloads. Using: Spark Scala - PySpark - Python - Hadoop - Cloud - Hive - SparkML - SQL, noSQL, Kafka, oozie, rest api, Structured streaming, delta lake, databricks, Machine Learning , aws , spark optimization , kibana , scrum master, swagger, project management, azure databricks, hdfs, S3, spark , cluster configuration. Tableau software,Git, Kibana, Ansible, Grafana.

Consulter toutes les expériences de Habib

Soyez le premier à recommander Habib

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master's degree
Sorbonne Université
2018
ISSI Master , proposed by the UPMC University - Paris This Master's Program provides knowledge and experience in image/audio processing for smart systems including Deep and Machine learning. These are the Labs supporting the Program: * L'Institut des Systèmes Intelligents et de Robotique (ISIR, UPMC, INSERM, CNRS) * L'Institut de La vision (IDV, CNRS, INSERM, UPMC) * UMR sciences et technologie de la musique et du son (STMS, IRCAM, UPMC)
Master's degree
Paris-Sud University (Paris XI)
2017
Master 1 E3A at Paris-Sud Paris This Master's program prepares students to a more advanced studies in electronics, computer science, image processing and machine learning

Consultez la formation qu'a suivie Habib

azure databricks
databricks
2021
databricks deltalake
databricks
2021

Les certifications de Habib sont accessibles uniquement aux membres Malt

Habib Herbi

Freelance Big Data Engineer & Cloud

À propos de Habib

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories