top of page

Évaluation des données
 

Data Assessmet

De quoi s'agit-il?
 

Odoma évalue systématiquement la qualité des données, en termes de contenu et de structure, de formats, de gestion et de documentation.
 

Nous sommes souvent sollicités pour des évaluations complètes de la qualité OCR/HTR et pour connaître les bonnes pratiques et les normes dans les flux de travail de numérisation.

Résultats:
 

  • Obtenez un aperçu clair de la qualité et de l'état de préparation de vos données en vue d'une utilisation future 
     

  • Obtenez des conseils sur la meilleure façon d'organiser les workflows de données, l'évaluation, la gestion et la publication
     

  • Préparer le terrain pour des interventions visant à améliorer la qualité des données et les flux de travail

Des données au jeu de données
 

Dataset

De quoi s'agit-il?

Un jeu de données est un ensemble de données ayant un objectif clair, structuré selon un modèle de données robuste. Son contenu et ses limites sont connus, ce qui permet une utilisation responsable au sein et en dehors d'une organisation.

 

Odoma est spécialisée dans la conversion de données brutes en ensembles de données utilisables. Nous aidons nos clients à évaluer systématiquement l'état actuel de leurs données et des flux de données associés. Nous proposons ensuite des interventions en fonction des objectifs du client, et nous exécutons la collecte, la consolidation et la documentation des données, en suivant les bonnes pratiques et les normes les plus récentes.

 

Odoma est également en mesure de soutenir le client dans l'utilisation future des ensembles de données, leur gestion et la création de flux de travail générant des données, par exemple pour développer des applications d'IA, utiliser la science des données ou publier des ensembles de dataset (voir aussi Données ouvertes et FAIR).

Résultats:

  • Cataloguer et consolider les sources de données brutes existantes
     

  • Améliorer les workflows de données en vue des besoins futurs
     

  • Comprendre les lacunes, les problèmes et les opportunités manquées
     

  • Concevoir et développer de nouveaux workflows générateurs de données
     

  • Préparez votre organisation pour les applications et les services basés sur les données

Annotations

Annotations de haute qualité
 

De quoi s'agit-il?

L''IA et les évaluations de données nécessitent souvent des annotations de haute qualité (vérité terrain), entièrement ou partiellement validées par des experts humains.

 

Odoma est spécialisée dans la conception, le pilotage, l'exécution et l'évaluation de campagnes d'annotation pour une variété de tâches, notamment l'analyse d'images, l'extraction de textes, l'extraction d'informations, le traitement du langage naturel et des images.

 

Odoma est expérimentée dans l'utilisation des normes internationales, les typologies d'annotation et les formats de données.

 

Grâce à nos solides antécédents en matière de recherche, nous offrons un accès à des techniques d'IA avancées telles que l'active learning, pour minimiser la quantité de données annotées nécessaires pour atteindre l'objectif du client.

Résultats:

  • Obtenez des conseils sur les bonnes pratiques, les normes et les outils pour les campagnes d'annotation
     

  • Développez des guidelines et des flux de travail d'annotation pour garantir des résultats optimaux
     

  • Menez des projets pilotes pour évaluer le potentiel avant de lancer une campagne
     

  • Mener des campagnes d'annotation avec des dépendances complexes
     

  • Minimiser les coûts et maximiser les résultats grâce à l'apprentissage actif appuyé par des annotations d'experts

DataCards

Data Cards et documentation
 

De quoi s'agit-il?

Les Data Cards sont des résumés structurés de faits essentiels concernant les aspects clés d'un ensemble de données qui informent les parties prenantes en vue d'une utilisation éclairée et responsable.

 

Les Data Cards incluent les critères de sélection, les limites, les analyses descriptives des données, les divulgations et les contraintes juridiques et pratiques. Elles deviennent un standard dans les applications d'IA.

 

Odoma est spécialisée dans la documentation de jeux de données indépendamment ou en vue de leur utilisation pour l'IA et pour l'analyse.

 

Les Data Cards ne sont qu'un des moyens par lesquels nous aidons nos clients à créer une documentation de haute qualité pour leurs ensembles de données, afin de faciliter leur réutilisation dans l'ensemble de leur organisation. 

 

Travaux de recherche en lien:

Data card: https://github.com/budh333/UnSilence_VOC/blob/v1.3/Datacard.pdf

Identification d'entités dans des archives coloniales historiques: https://arxiv.org/abs/2210.02194

Résultats:

  • Obtenez une documentation cohérente, complète, intelligible et concise sur vos données, qui apporte de la clarté tout en faisant ressortir les incertitudes
     

  • Facilitez la réutilisation des ensembles de données au sein de votre organisation
     

  • Préparez vos ensembles de données pour une diffusion ouverte ou leur utilisation dans des applications d'IA

Open Data

Données ouvertes et FAIR
 

De quoi s'agit-il?

La publication de données ouvertes est de plus en plus populaire parmi les organisations culturelles et créatives, car elle favorise l'engagement des utilisateurs, la réutilisation créative, la recherche et l'éducation.

Les données ouvertes doivent respecter les principes FAIR (Findable, Accessible, Interoperable, Reusable) : https://www.go-fair.org/fair-principles.

Grâce à notre grande expérience de la science ouverte, nous aidons nos clients à publier des données ouvertes et conformes aux principes FAIR, et à organiser des concours publics, des tâches partagées et des hackathons.

Résultats:

  • Gagnez en visibilité en publiant des données ouvertes
     

  • Engagez le dialogue avec un large public dans l'enseignement, la recherche et l'industrie
     

  • Externalisez des tâches par le biais de concours ouverts et de hackathons.

bottom of page