You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Houcine Ben GuedriaHB

Houcine Ben Guedria

Data Engineer | PySpark · Databricks · AWS

480 €/jour
Tunis, TN
3-7 ans

Délai de réponse moyen : 1h

À propos de Houcine

Data Engineer avec 4+ ans d'expérience sur des projets internationaux. Je conçois des pipelines de données robustes, des architectures cloud AWS/Azure et des solutions de traitement à grande échelle avec PySpark et Databricks. Disponible en remote, facturation B2B.
  • Français

    Bilingue ou natif

  • Anglais

    Bilingue ou natif

En télétravail uniquement
Travaille majoritairement à distance

Expériences

  • Fathom Data
    Data Engineer / Data Scientist
    août 2023 - mai 2026 (2 ans et 9 mois)
    ▸ Conception et maintenance de pipelines ETL/ELT robustes sur AWS, assurant une livraison fiable des données
    pour les workflows analytiques et ML sur plusieurs projets clients.
    ▸ Développement d'un pipeline d'analyse de parcours à grande échelle avec PySpark sur Databricks, traitant
    plus de 3M de lignes pour calculer les coûts uniques par étape produit et fournir des insights opérationnels.
    ▸ Développement de services data backend (Python, FastAPI, Flask, PostgreSQL) avec Marshmallow pour la
    validation de schémas et Alembic pour les migrations de base de données, permettant un accès aux données
    en temps réel.
    ▸ Conception de templates d'infrastructure Terraform réutilisables pour un déploiement cohérent et
    reproductible entre projets clients, réduisant significativement les délais de mise en place.
    ▸ Mise en place de pipelines CI/CD (GitHub Actions, Docker) pour améliorer la vitesse de déploiement et
    réduire les erreurs manuelles.
    ▸ Automatisation de la configuration système sur machines Linux clients via Ansible, incluant la gestion des logs
    et la supervision.
    ▸ Livraison d'un pipeline de vision par ordinateur conteneurisé (YOLO, 1 800 images labelisées, Azure) avant
    transition vers l'ingénierie des données.
    Databricks Python PySpark Gitlab CI/CD Docker
  • Govwise
    Data Scientist
    mars 2022 - mars 2023 (1 an)
    ▸ Développement d'algorithmes de matching en Python pour aligner les utilisateurs avec des contenus
    pertinents, améliorant l'engagement et la rétention.
    ▸ Construction de pipelines de web scraping automatisés (Selenium, Playwright) pour collecter et structurer de
    larges jeux de données pour l'analyse.
    Pandas Python Playwright Web Scraping PostgreSQL

Recommandations

Soyez le premier à recommander Houcine

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Certifications

Compétences

Catégories