Présentation

Introduction

Il existe un intérêt grandissant pour sauvegarder numériquement et offrir un accès aux collections de documents historiques résidant dans les librairies, musées et archives. Des archives de documents anciens comme celles-ci représentent une vraie richesse, mémoire de nos sociétés. Ces documents n'ont pas seulement une valeur historique pour leur apparence physique mais également pour leur contenu. Par exemple, des manuscrits uniques écrits par des scientifiques, artistes ou écrivains célèbres ; les lettres, sous forme marchande ou de document officiel, qui rappellent des faits historiques ; un lieu ou moment précis ; des éléments artistiques comme des timbres, des illustrations, des couvertures, etc.

 

D'un autre coté, il y a également un besoin de préservation de l'héritage technique de la part des entreprises et des institutions publiques. On peut prendre pour exemple les vieux dessins techniques ou les plans cadastraux. L'enjeu actuel au niveau européen est de convertir cet héritage en librairies numériques qui permettent de le conserver mais également de le rendre accessible dans le monde entier par l'intermédiaire d'un portail web. Les citoyens du futur pourront, en utilisant des bibliothèques numériques conéues pour, accéder a des myriades de formes de connaissances à partir de n'importe où, n'importe quand, facilement et rapidement.


L'intérêt n'est pas seulement de numériser des documents mais également de créer une librairie numérique sémantiquement riche de ces documents numériques. Des documents enrichis signifient l'ajout d'annotations sémantiques aux images numériques des documents scannés. De telles métadonnées permettront de décrire, classer et indexer des documents par leurs contenus. Cela permettrait n'importe où, n'importe quand un accès naturel à un héritage culturel et scientifique.

 

Ainsi, le but principal de recherche de ce projet est de travailler dans un cadre collaboratif sur l'Analyse de Documents. Ce but consiste à développer des techniques de Reconnaissance de Formes et d'Analyses d'Images qui permettent d'extraire une connaissance des documents et de les convertir en une bibliothèque électronique qui contiendrait les pages numérisées et enrichies avec une information sémantique.

 

Le patrimoine culturel et scientifique de l'Europe est un bien public unique qui représente la mémoire collective et vivante de nos différentes sociétés. La communauté internationale (gouvernements, organismes) ressent un besoin grandissant de sauvegarder ce patrimoine et de démocratiser l'accès de celui-ci. Les intérêts sont nombreux, nous pouvons citer quelques domaines : l'enseignement, l'industrie du tourisme, les médias ...

C'est ici qu'intervient le projet NaviDoMAss qui a pour mission de mettre en valeur différents biens du patrimoine international et plus particulièrement les ouvrages, les collections d'images et autres documents iconographiques. A court terme, ces nombreux documents constitueront une source gigantesque d'information (masse de données). L'objectif de ce projet est de contribuer à la réalisation de systèmes d'indexation d'images de document du patrimoine. Ce projet s'inscrit ainsi dans la volonté actuelle de préserver le patrimoine culturel et scientifique et d'assurer au plus grand nombre l'accès à ce patrimoine.

Problématiques

Considérant la grande quantité d'information à stocker, il est nécessaire de se pencher sur certains problèmes :

  • Tout d'abord la consultation en mode image des documents patrimoniaux suppose leur archivage et exige donc d'examiner de manière approfondie les possibilités spécifiques de compression de ces masses de documents.
  • Se pose aussi le problème de simplifier au maximum la recherche d'un document. L'idée est de déterminer des indices s'adaptant aux différentes représentations de l'information que l'on peut rencontrer dans les documents patrimoniaux comme des zones textuelles, des images, des illustrations graphiques. Ces indices apportent des connaissances spécifiques qui aideront à la navigation.
  • Enfin, il est important de souligner que certains facteurs (culturels, sociaux ou économiques) risquent toutefois d'empêcher d'exploiter pleinement le potentiel de ces ressources, du moins dans un premier temps. C'est pour ces raisons que ce projet vise aussi et en outre à renforcer les actions de sensibilisation sur les problèmes de conservation des données et par conséquent à générer des investissements et à établir une politique européenne commune sur l'utilisation du contenu culturel déjà numérisé.

Groupes de travail

Les différents laboratoires sont rassemblés autour de groupes de travail

Groupe de Travail
Thème
Laboratoires participants
0
Management du projet
L3i / LI
1
Les besoins utilisateurs, conception collaborative et vérité terrain
CESR / L3i
2
Analyse des couches des documents et indexation basée sur la structure
LITIS / LI
3
Recherche d'informations
LI / LITIS / Loria
4
Structurer l'espace d'information
LORIA / L3i
5
Extraction et contrôle interactifs
LI / L3i / Loria

 

Résultats

Les résultats du projet NaviDoMass sont à venir.

Les documents de synthèse :