You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Osman GaygusuzOG

Osman Gaygusuz

Data Scientist & Engineer

200 €/jour
Strasbourg, FR
0-2 ans

Délai de réponse moyen : 1h

À propos de Osman

Data scientist junior doté de solides bases Data Engineering, maîtrisant Python et SQL. Je conçois et déploie des pipelines de données de bout en bout et des workflows d'apprentissage automatique, depuis l'ingestion des données et l'ingénierie des caractéristiques jusqu'à la modélisation et la mise en production avec Docker, ainsi que le déploiement d'applications interactives ou de tableaux de bord (Streamlit, React) pour présenter les résultats et les informations aux utilisateurs, en écrivant un code Python propre et facile à maintenir qui transforme les données brutes en informations exploitables grâce à des pipelines d'apprentissage automatique robustes. J'utilise Databricks (PySpark) pour créer des workflows évolutifs et appliquer des modèles de pointe afin de générer des résultats fiables. Je conçois, teste et évalue également des solutions d'IA générative en appliquant et en comparant plusieurs modèles d'embedding et de LLM afin de créer des workflows basés sur les LLM (RAG, recherche sémantique, extraction de connaissances). Dans ce contexte, je collabore avec des équipes interfonctionnelles pour clarifier les exigences, communiquer clairement les informations et fournir des solutions de manière efficace.
  • Français

    Bilingue ou natif

  • Turc

    Bilingue ou natif

  • Anglais

    Bilingue ou natif

  • Allemand

    Capacité professionnelle complète

  • Polonais

    Notions

Accepte de travailler sur site
Strasbourg (jusqu’à 50 km)

Expériences

  • Mercedes-Benz AG, HQ,
    Master's degree intern as Data Scientist (GenAI/ NLP)
    mars 2025 - août 2025 (5 mois)
    70 Stuttgart, Germany
    • • Built Python and PySpark machine learning workflows on Azure Databricks to preprocess and transform distributed multi-source data, applying unsupervised learning techniques (clustering, similarity learning, dimensionality reduction) and embedding-based GenAI approaches to semantically structure and organize complex datasets.
    • • Designed and implemented a patent-pending solution within the Mercedes-Benz After-Sales department to detect semantically equivalent data across heterogeneous enterprise services by mapping data elements into shared embed ding spaces. Developed, benchmarked and evaluated multiple language-based models (Sentence-BERT, FastText, Word2Vec) to optimize semantic similarity performance and ensure consistent identification of related data despite structural and format differences.
    • • Improved semantic matching performance from 40% to over 90% coverage, enabling identification of the majority of semantically equivalent After-Sales data fields from a single representative data sample, significantly reducing manual data discovery for engineers and analytics teams.
    • • Communicated and formalized project outcomes by presenting results to technical and business stakeholders, produc ing internal documentation, and contributing to the initiation of a patent filing and the scaling of the project beyond a proof-of-concept.
    • • Contributed to an AI-powered legal assistant proof-of-concept by setting up Docker-based deployment, writing Python scripts, defining and executing feature tests, and translating requirements between cross-functional team members and legal stakeholders into concrete technical specifications and implementation steps.
    • • Python, SQL, Databricks, PySpark, Docker, TensorFlow, scikit-learn, FastAPI, PyTorch, HuggingFace, OpenCV, React
    Python SQL Machine learning Data science Deep Learning
  • SIDEC du Jura,
    intern as Data Engineer
    janvier 2023 - septembre 2023 (8 mois)
    France
    • • Designed and implemented end-to-end ETL pipelines using SQL, and FME, integrating heterogeneous data sources from multiple business units into a centralized data warehouse.
    • • Developed an automated data processing and reporting tool using Python that generates mission summary sheets and significantly reduces manual data retrieval time for field agents.
    • • Performed in-depth data exploration and cleaning to resolve data silos and inconsistencies, while improving data gov ernance practices and standardizing dataset documentation across departments.
    • • Python, SQL, ETL(FME), Dbeaver, Metabase
    SQL Python Intégration de données (ETL, ELT et entreposage de données) Processus ETL (Extract, Transform, Load) Data Engineering

Recommandations

Soyez le premier à recommander Osman

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Bachelor's degree
    2024
    Bachelor's degree
  • Engineering Degree
    UTBM – University of Technology of Belfort-Montbéliard
    2025
    Engineering Degree

Compétences

Catégories