À propos de Nada
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Arabe
Bilingue ou natif
Espagnol
Capacité professionnelle limitée
Expériences
- TF1Lead Data Scientist / MLOpsPRESSE & MÉDIASjanvier 2025 - Aujourd'hui (1 an et 5 mois)Boulogne-Billancourt, France
- Gestion de projet de Machine Learning du POC à la mise en production
- Construction et entrainement de modèles Machine Learning et Deep Learning sur des données structurées et non structurées pour diverses applications telles que : La recommandation sur MyTF1 et TF1Info, amélioration du référencement SEO du site TF1Info, Analyse prédictive pour le ciblage publicitaire MyTF1...
- Expérience approfondie de Snowflake pour interroger et analyser des Données Big Data
- Preprocessing de données et modélisation ML sur Databricks avec du tracking via Mlflow.
- Conception et planification des DAGs Airflow pour automatiser le pipeline d’entrainement des modèles.
- Développement d’APIs pour exposer les modèles, utilisation de Azure DevOps pour le versioning du code, et les pipelines CI/CD incluant tests de sécurité, et de charge.
- Déploiement de conteneurs dans des clusters Kubernetes pour optimiser la performance et la scalabilité des applications.
- Monitoring en temps réel des modèles en production notamment les temps de réponse des algorithmes, les taux de succès, et le nombre de requêtes, accompagnée de systèmes d'alerting.
- Brut.Lead Data ScientistCINÉMA & AUDIOVISUELoctobre 2021 - décembre 2021 (3 mois)Paris, FranceResponsable Data de Brutx : la plateforme streaming de l’entreprise Brut.- Audit de la qualité des données existantes et sollicitation des partenaires pour des nouvelles données pertinentes et nécessaires à nos études.- Data mining sur de gros volumes de données afin de calculer les KPIs de l'entreprise (Recrutés , abonnés, churns , revenus etc..)- Analyse de segmentation clients- Modèle de ML pour la prédiction du taux de churn (désabonnement) en fonction du canal d'acquisition , de la quantité de consommation sur la plateforme, la saisonnalité etc...Modèle de NLP sur les données des questionnaires churners (analyse de sentiment, topic modeling …) pour l’amélioration du contenu Brutx et la réduction du taux de désabonnement.Modèle de NLP pour prédire le taux d’ouverture des mails de newsletters.
- Sorbonne UniversitéRecherche en Natural Language ProcessingCENTRES DE RECHERCHEjuin 2021 - Aujourd'hui (5 ans)Paris, FranceDans le cadre d'un projet de recherche en Data to Text à Sorbonne université, le défi était de créer un modèle de Deep Learning capable de générer des données textuelles à partir de données structurées et inversement.Application : génération de résumés en langage naturel à partir de série temporelles / données structurées, ou extraction de chiffres clés à partir de données textuelles.- Etudes de l’état de l’art dans le domaine du NLP et du Data to Text. Choix du modèle Transformer T5 préentrainé et adaptation de ce modèle à la tâche du Data to Text et Text to Data- Entrainement supervisé (Transfer Learning avec HuggingFace)- Entrainement cyclique non supervisé le modèle T5 (Transfer Learning avec HuggingFace)- Modification de l’architecture du modèle T5 afin d’intégrer un espace latent probabiliste (Conditional Variational Autoencoders) pour contrôler la génération du texte et des données structurées- Entrainement distribué sur plusieurs GPUs . Tracking avec MLFLOW
Recommandations
Soyez le premier à recommander Nada
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Ingénieur Mathématiques AppliquéesEcole Centrale de Nantes2015- Spécialité: Mathématiques Appliquées et Finance d'entreprise - Tronc commun: Mathématiques, Mécanique, Electronique, Physique - Cours transversaux: Management de projet, Finance, Economie, Communication...
- Master Intelligence Artificielle , Systèmes, DonnéesUniversité Paris Dauphine - ENS Paris - Mines PariTech2020- Modèles de Machine Learning et de Deep Learning - Traitement de données et Machine learning en environnement Big Data - Computer Vision - Natural Language Processing - Apprentissage par renforcement et Recherche Arborescente de Monte Carlo - IA on the cloud : AWS (IA services et Sagemaker) - Traitement de données en streaming avec Kafka et Flink - Données NoSQL ( Neo4, MangoDB et ArangoDB) - Data visualization (Tableau , plotly, bokeh)