Rechercher un freelance Déposer un projet

Bienvenue sur le profil Malt de Sacha !

Malt vous permet d'accéder aux meilleurs consultants freelances pour vos projets. Contactez Sacha pour échanger sur votre besoin ou recherchez d'autres profils sur Malt.

Sacha Du

data scientist, développeur python 5 ans

Peut se déplacer à Paris

  • 48.833
  • 2.3269
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Sacha.
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Sacha.

Localisation et déplacement

Localisation
Paris, France
Peut travailler dans vos locaux à
  • Paris 14e Arrondissement et 50km autour

Préférences

Durée de mission
  • entre 3 et 6 mois
  • ≥ 6 mois
Secteur d'activité
  • Aéronautique & aérospatiale
  • Agence & SSII
  • Agroalimentaire
  • Architecture & urbanisme
  • Arts & artisanat
+46 autres
Taille d'entreprise
  • 1 personne
  • 2 - 10 personnes
  • 11 - 49 personnes
  • 50 - 249 personnes
  • 250 - 999 personnes
+2 autres

Vérifications

Charte du freelance Malt signée
Consulter la charte

E-mail vérifié

Langues

Catégories

Compétences (26)

Sacha en quelques mots

Bonjour,

J’ai suivi le master Informatique, Mathématiques et Statistiques appliquées à l’école d’ingénieurs Télécom SudParis, promo 2016. J'évolue depuis dans le monde professionnel et tout le long de mes expériences, ma casquette a oscillé entre Data Scientist et Data Engineer. Essentiellement, mon travail consiste à conceptualiser et maintenir des applications de machine learning ou de data processing. Quotidiennement cela revient à:
- Récupérer et cadrer un besoin auprès d’un métier (définition d'objectifs, de mesures de performance...),
- Formaliser le besoin et récupérer les données disponibles et pertinentes (SQL/Spark/Hive.Pyspark...)
- Faire de la veille technologique sur les méthodes disponibles (beaucoup de lecture de papiers état de l’art)
- Implémenter un POC
- Déployer le modèle en production (on premise ou sur le cloud)

En parallèle de mon parcours professionnel j'ai toujours été proche du milieu de l'enseignement. J'ai donné des cours de Data Science pour le bootcamp Jedha, j'ai donc une certaine facilité pour communiquer et transmettre mes idées.
Pour de plus amples informations sur les projets sur lesquels j’ai pu travailler je vous laisse consulter mon profil Linkedin.

Concernant ma stack technique:
- Big Data / Traitement de données: SQL, Hive, Spark, Pyspark, BigQuery, Redshift
- Machine Learning: Python (scikit-learn, tensorflow, tensorflow probability), Spark ML, R
- Production: Git, Concourse, Docker, Flask
- Cloud: environnements Google Cloud et AWS
- Dataviz: Plotly, Bokeh, R-Shiny.
Je suis disponible pour toute question, vous avez mes coordonnées dans mon CV alors n'hésitez pas !

À très vite,
Sacha

Expériences

Jedha Bootcamp

High tech

Professeur de Data Science  - En tant que freelance

Paris, France

janvier 2020 - décembre 2020 (11 mois)

Jedha Bootcamp est un bootcamp (un cours accéléré) en Data Science qui propose des formations allant
de 3 à 6 mois.

Chaque module s’étale sur 1 mois et demi et a lieu le lundi soir et le samedi toute la journée.

Les classes sont constituées d’une vingtaine d’élèves possédant un niveau suffisant pour pouvoir suivre le
bootcamp.

Dans ce cadre, j’ai animé les 3 modules suivants: Python / Analyses Statistiques / Deep Learning

Pôle emploi

Secteur public & collectivités

Lead Data Scientist  - En tant que freelance

Paris, France

juillet 2019 - octobre 2021 (2 ans et 3 mois)

Lead Data Scientist Intégré au département Big Data au sein de la direction générale de Pôle Emploi. Mise en production d'algorithmes d'IA dans le cadre du projet Intelligence Emploi:

• Elaboration d'un cockpit à destinations des conseillers entreprise pour objectiver la prise de décision tout au long de la gestion des offres d'emploi.
- Prédiction du délai de pourvoi d'une offre d'emploi
- Comparaison du délai prédit à celui d'offres similaires sur un même contexte géo-économique
- Scoring de l'offre relativement au contexte
- Explication des prédictions avec des outils de machine learning pour accompagner conseillers et recruteurs dans leurs prises de décision.

• Création d'un outil de ciblage d'entreprises avec un fort potentiel d'embauche pour aider les conseillers entreprise dans leur démarche de prospection et de promotion de profil de demandeur d'emploi.
- Modèle LSTM qui utilise les embauches passées des entreprises + des données "statiques" sur l'entreprise + des indicateurs géo-économiques sur le bassin d'emploi.
- Prédiction du nombre d'embauches avec une granularité au semestre

Livrables:

Représentant du département Big Data au sein du projet, discussions avec les équipes métier pour
définir et suivre le besoin et les exigences du projet (définition des KPI, etc)

Listing et récupération des données sous Python/Spark

Listing des librairies Python et implémentation de plusieurs algorithmes (XGBoost, RandomForest,
Réseau de Neurones) pour prédire le délai de pourvoi d’une offre d’emploi, séléction du meilleur
modèle Python scikit-learn/tensorflow

Packaging de l’application Python

Mise en production du meilleur modèle une fois que les KPIs ont été atteints (échanges avec les
équipes DSI pour les exigences fonctionnelles, implémentation de l’API en Python/Flask et
Dockerisation)

Modelisation, Machine Learning - Deep Learning: Python / Scikit-learn / Tensorflow Probability / LIME / SHAP
Mise en production: Python / Hive / Docker / Flask - API REST
Tech Lead Data science Machine learning Python Spark Git Docker API REST Artifactory

Zenly

Edition de logiciels

Consultant Data Scientist  - En tant que freelance

Paris, France

janvier 2019 - avril 2019 (3 mois)

Zenly est un réseau social géolocalisé qui permet de voir ses amis en temps réel sur une map.

Dans ce cadre et dans le but d’améliorer le produit, j’ai été contacté pour implémenter un algorithme de détection de mode de transport en temps réel utilisant les données de sensors des smartphones des utilisateurs. Les sensors sont par exemple l’accelérometre, le GPS ou le baromètre. Ils fournissent une
représentation physique de l’état du téléphone.

Les différents modes de transport prédits sont: Statique, marche, cours, à vélo, motorisé, train

Livrables:
Étude de l’état de l’art, veille technologique

Collecte des données des différentes sources notamment les données d’accelérometre et de GPS générés par des smartphones de l’entreprise ou des bases de données

Mise en forme des données (harmonisation de l’échantillonage entre les différentes sources notamment) (Python/Numpy)

Traitement de données: data augmentation, data flipping, data rotation

Algorithme de traitement du signal via un réseau de neurones convolutionnel qui prédit le mode de transport actuel d’un individu par tranche de 0.3ms (Python/Tensorflow)

Évaluation du modèle (optimisation, calcul d’hyper-paramètres optimaux…) => Accuracy globale de 92%

Implémentation d’un démonstrateur sur smartphone pour pouvoir tester le modèle entraîné en temps réel. Le démonstrateur est implémentée en Java et embarque le modèle au format TensorflowLite (adapté pour être shippé sur mobile). L’application affiche en temps réel la probabilité de chaque mode de transport

Rédaction de documentation technique.

MWM

High tech

Data Scientist

Boulogne-Billancourt, France

janvier 2017 - janvier 2019 (2 ans)

Recommandations externes

Consultez les recommandations qu'a reçues Sacha

Formations