Bienvenue sur le profil Malt de Cynthia !

Malt vous permet d'accéder aux meilleurs consultants freelances pour vos projets. Contactez Cynthia pour échanger sur votre besoin ou recherchez d'autres profils sur Malt.

Cynthia Elisabeth

phd, chef de projet - consultante data

Peut se déplacer à Saint-Denis

  • -20.879
  • 55.4481
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Cynthia.
Proposer un projet La mission ne démarrera que si vous acceptez le devis de Cynthia.

Localisation et déplacement

Localisation
Saint-Denis, France
Peut travailler dans vos locaux à
  • Saint-Denis et 20km autour

Préférences

Durée de mission
  • ≤ 1 semaine
  • ≤ 1 mois
  • entre 1 et 3 mois
  • entre 3 et 6 mois
Secteur d'activité
Préfèrerait :
  • Banque & assurances
  • Conseil & audit
  • Edition de logiciels
  • Agence & SSII
  • Centres de recherche
Préfèrerait éviter:
Grande distribution
Taille d'entreprise
  • 2 - 10 personnes
  • 11 - 49 personnes

Vérifications

Langues

Catégories

Compétences (25)

  • Methodologies
  • Débutant Intermédiaire Confirmé
  • Data Science
  • Débutant Intermédiaire Confirmé
  • Tous
  • Débutant Intermédiaire Confirmé

Cynthia en quelques mots

Doctor of Philosophy (PhD) in Computer Sciences, my research topic is data mining applied to textual information extraction in document images.
10 years of work experience in software engineering (J2EE, Talend), data base (Oracle and others) conception and administration (data replication environment), ETL (with Talend Open Studio), data Warehouse designing for business reporting and more.
In the same time, I acquired skills in team management and IT project management.

#remoteWork

Expériences

Université de La Réunion

Centres de recherche

Thèse de doctorat

Saint-Denis, France

octobre 2011 - octobre 2017 (6 ans)

CONCEPTION D’UN SYSTEME ORIGINAL D’EXTRACTION D’INFORMATIONS TEXTUELLES AU SEIN DE DOCUMENTS NUMERISES

Laboratoire d’Informatique et de Mathématiques, Université de La Réunion

Titre : Extraction d’informations textuelles au sein de documents numérisés : cas des factures

Résumé :
Le traitement automatique de documents consiste en la transformation dans un format compréhensible par un système informatique, de données présentes au sein de documents et compréhensibles par l’Homme. L’analyse de document et la compréhension de documents sont les deux phases du processus de traitement automatique de documents.
Dans ce mémoire, nous considérons en particulier des documents numérisés, également connus sous le nom d’images de documents. Plus précisément, nous nous intéressons à la localisation d’informations textuelles au sein d’images de factures, afin de les extraire à l’aide d’un moteur de reconnaissance de caractères. Les factures sont des documents très utilisés mais non standards. En effet, elles contiennent des informations obligatoires (le numéro de facture, le numéro siret de l’émetteur, les montants, etc.) qui, selon l’émetteur, peuvent être localisées à des endroits différents. Les contributions présentées dans ce mémoire s’inscrivent dans le cadre de la localisation et de l’extraction d’informations textuelles fondées sur des régions identifiées au sein d’une image de document.
[...] nous proposons un système d’extraction d’informations textuelles qui consiste en un ensemble de régions prototypes et de chemins pour parcourir ces régions prototypes. Le cycle de vie de ce système comprend cinq étapes :
1. Construction d’un jeu de données synthétiques à partir d’images de factures réelles contenant les informations d’intérêts.
2. Partitionnement des données produites.
3. Détermination des régions prototypes à partir de la partition obtenue.
4. Détermination des chemins pour parcourir les régions prototypes, à partir du treillis de concepts d’un contexte formel convenablement construit.
5. Mise à jour du système de manière incrémentale suite à l’insertion de nouvelles données.

Mots-clefs : traitement automatique de documents ; extraction d’informations textuelles ; classification supervisée ; classification non supervisée ; décomposition quadtree ; analyse formelle de concepts ; treillis de concepts.

Environnement technique : Java, Python, R Studio, The Concept Explorer (logiciel d’exploration de concepts formels), RapidMiner, Tanagra, Weka, Tesseract OCR

Groupe Austral Assistance

Banque & assurances

Responsable des applications et des données

Saint-Denis, France

juillet 2011 - Aujourd'hui (10 ans et 3 mois)

INDUSTRIALISATION DE L’ENVIRONNEMENT DE DEVELOPPEMENT DES APPLICATIFS METIER

Environnement technique : application J2EE déployée sur serveur d’application JBOSS 5 – bases de données Oracle 12c
Projet en sous-traitance :
- Audit du code source et de l’environnement technique
- Initiation d’un chantier de refactoring : redéfinition des modules et des livrables ; suppression des dépendances circulaires ; migration JBOSS vers Wildfly ; nettoyage du code et respect des standards
- Mise en place de l’usine de développements : « Mavenisation » des modules ; mise en place d’un gestionnaire de référentiels Maven ; mise en place d’un serveur d’intégration continue (Nexus, Jenkins)
- Standardisation des développements et soumission des modules à l’intégration continue : révision de l’architecture applicative ; mise en place d’un socle et de normes de développements ; livraison avec l’usine de développement
- Amélioration continue et évolutions : mise en place de tests unitaires et de tests d’intégration ; refactoring du code ; respect des normes pour le développement de nouvelles fonctionnalités
Activités :
- Définition du cahier des charges
- Sélection du prestataire
- Validation du cahier des charges et des livrables attendus
- Accompagnement de la phase d’audit (en tant qu’experte technique)
- Planification des phases projet/suivi des délais
- Animation des comités de pilotage, suivi et ateliers techniques
- Recette
- Suivi du déploiement et validation des livrables
- Clôture du projet

Groupe Austral Assistance

Banque & assurances

Responsable des applications et des données

Saint-Denis, France

juillet 2011 - Aujourd'hui (10 ans et 3 mois)

CONCEPTION DE FLUX E/S D’ECHANGES DE DONNEES AVEC DES SYSTEMES TIERS

Environnement technique : base de données Oracle 12c/19c, Talend Open Studio
- Transmission sftp de ressources documentaires provenant de plusieurs systèmes de fichiers et liées à des données métiers stockées en base
- Traitement et intégration en base d’informations de facturation transmises dans des fichiers plats
- Transmission de données de production stockées en base dans des fichiers (positionnés, délimités, excel) vers des systèmes tiers
- Croisement de données provenant de sources hétérogènes pour stockage dans une base de données unique

Groupe Austral Assistance

Banque & assurances

Responsable des applications et des données

Saint-Denis, France

juillet 2011 - Aujourd'hui (10 ans et 3 mois)

2 recommandations externes

Consultez les recommandations qu'a reçues Cynthia

Formations