Johann Grisel

machine learning engineer, data manager

Peut se déplacer à Paris, Le Havre, Lille, Lyon, Nantes

  • 48.8546
  • 2.34771
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Johann.
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Johann.

Localisation et déplacement

Localisation
Paris, France
Peut travailler dans vos locaux à
  • Paris et 20km autour
  • Le Havre et 40km autour
  • Lille et 20km autour
  • Lyon et 20km autour
  • Nantes et 20km autour

Vérifications

Langues

Catégories

Compétences (33)

  • BigData
  • Débutant Intermédiaire Confirmé
  • Débutant Intermédiaire Confirmé
  • Data Science
  • Débutant Intermédiaire Confirmé

Johann en quelques mots

Data Scientist (Thèse professionnelle, mastère spécialisé) spécialisé dans le Big Data avec des compétences en chimie (agrégé de physique-chimie), en IoT et conversion de puissance (Certificat en instrumentation et capteurs) ainsi qu'en management (gestion d'équipes pendant 12 ans), je mets mes capacités au service du Machine Learning Engineering et du Team Management dans des domaines variés (Administration publique, Finance, Marketing, Industrie). Excellent communicant, expert en formation (numérique et énergie, notamment), je travaille sous Python, R, TensorFlow (Keras), Hadoop (Hive), Spark et GCP en mode Agile (Scrum).

- Outils :
Python, R, SQL, HIVE, Keras (TensorFlow), Plotly / Dash, Spark MLlib, Spark RDD & DataFrames, Spark Streaming, Spark GraphX, HADOOP, PySpark, GAMS, CPLEX, OSQP, cvxpy, SQL, LateX, Office, Acrobat, Jupyter, Git, Scrum, PERT, Gantt, ActivePresenter, Photoshop.

- Techniques déjà mises en œuvre :
PCA, FAMD, GLRM, kNN, t-SNE, LDA, QDA, régression logistique, SVM, OC-SVM, SVDD, SGD, CART, Bootstrap, Bagging, Random Forest, Boosting, Adaboost, GBM, k-means, EM, dendrogramme, DBSACN, TF-IDF, SARMA, SARIMA, Holt-Winters, Collaborative Filtering, SVD, NMF, ALS, Bandit, Streaming, a priori, TPOT, H2O, CNN, RNN, NLP (TF-IDF, word2vec...), Computer Vision (Transfert Learning, VGG, YOLOv3, GAN...), Autoencoder, Audio (Librosa, signal processing...), Binning, Scaling, k-fold-CV, missing value, Anomaly detection, GLM, régressions (PCA, SVM, shrinkages Ridge & LASSO, Backward & Forward, VIF, GCV), Splines, GMM, Confusion matrix, ROC, AUC, régularisations, optimisation, simplexe, Dantzig-Wolfe & Benders, stochastique, métaheuristique (recuit simulé, essaims particulaires), graphes (Ford, Bellman, Moore-Dijkstra, Kruskal, Prim).

Portfolio

Portfolio uniquement accessible aux membres

Expériences

TheGreenData

Agroalimentaire

Data Miner

Paris, France

février 2020 - Aujourd'hui

- Data Cleaning, Data Munging (wrangling) : time series sous Python, classification (à partir de fichiers plats).
- Corrélations temporelles : timeshifts.
- Modèles : AutoRegressive Models, Hodrick-Presscott Filter, Logistic Regression.
- Rapports d'activité sous Notebook Jupyter.
- Préconisation algorithmique pour le client final.

Publicis - Publicis

Presse & médias

Data Scientist expert

Paris, France

octobre 2019 - janvier 2020

- Etablissement du cahier des charges, préconisation d'infrastructure pour le client final.
- Détermination d'un modèle "sur mesure" pour une campagne marketing.
- EDA et feature engineering de la base (80 GB, 166 tables, 1046 champs) sous SSMS, GCP et R.
- Optimisation algorithmique sous Python.
- Etude de faisabilité d'extension de base par geocoding.
- Présentations Workshops, communications techniques sur site et chez le client final.

Société Générale - Corporate & Investment Banking - Société Générale

Banque & assurances

Lead Data Scientist

Puteaux, France

septembre 2018 - septembre 2019

- Démarrage du projet from scratch, benchmarking des méthodes existantes.
- Lead de 5 ingénieurs Big Data, plan de charge.
- Encadrement et formation d'un alternant.
- Animation de réunions avec les métiers.
- Présentations des résultats aux services.
- Données sur Data Lake : 10 PB, 150 GB/jour.
- KPI liquidity, finance.
- Modélisation et implémentation des algorithmes de détectection d'anomalies dans le contexte financier.
- Chargement des données à partir de diverses sources (.csv, .xml).
- Data Munging (wrangling), Feature Engineering.
- Déploiement : LOF (local outlier factor), FAMD (factor analysis of mixed data), OC-SVM (one-class support vector machine), Isolation Forest, SVDD (support vector data description) linéaire et à noyau, GBT (gradient boosting tree), analyse des données symboliques, modèle de mélange, EVA (extreme value analysis).

Education nationale

Education & e-learning

Data Scientist, Chargé de mission d'inspection

Académie de Normandie

septembre 2014 - septembre 2018

2 recommandations externes

Formations

charter modal image

Notre succès est une oeuvre collective

Contribuez à cette réussite et au sérieux de la communauté en signant la charte du freelance Malt.

Signer la charte