Présentation
Introduction
l existe un intérêt
grandissant pour sauvegarder numériquement et offrir un
accès aux collections de documents historiques
résidant dans les librairies, musées et archives. Des
archives de documents anciens comme celles-ci représentent
une vraie richesse, mémoire de nos sociétés.
Ces documents n'ont pas seulement une valeur historique pour
leur apparence physique mais également pour leur contenu.
Par exemple, des manuscrits uniques écrits par des
scientifiques, artistes ou écrivains célèbres
; les lettres, sous forme marchande ou de document officiel, qui
rappellent des faits historiques ; un lieu ou moment précis
; des éléments artistiques comme des timbres, des
illustrations, des couvertures, etc.
un autre coté, il y a également un
besoin de préservation de l'héritage technique de
la part des entreprises et des institutions publiques. On peut
prendre pour exemple les vieux dessins techniques ou les plans
cadastraux. L'enjeu actuel au niveau européen est de
convertir cet héritage en librairies numériques qui
permettent de le conserver mais également de le rendre
accessible dans le monde entier par l'intermédiaire
d'un portail web. Les citoyens du futur pourront, en utilisant
des bibliothèques numériques conéues pour,
accéder a des myriades de formes de connaissances à
partir de n'importe où, n'importe quand, facilement
et rapidement.
intérêt n'est pas seulement de
numériser des documents mais également de
créer une librairie numérique sémantiquement
riche de ces documents numériques. Des documents enrichis
signifient l'ajout d'annotations sémantiques aux
images numériques des documents scannés. De telles
métadonnées permettront de décrire, classer et
indexer des documents par leurs contenus. Cela permettrait
n'importe où, n'importe quand un accès
naturel à un héritage culturel et scientifique.
insi, le but principal de recherche de ce projet est de
travailler dans un cadre collaboratif sur l'Analyse de
Documents. Ce but consiste à développer des
techniques de Reconnaissance de Formes et d'Analyses
d'Images qui permettent d'extraire une connaissance des
documents et de les convertir en une bibliothèque
électronique qui contiendrait les pages
numérisées et enrichies avec une information
sémantique.
Le patrimoine culturel et scientifique de l'Europe est un bien public unique qui représente la mémoire collective et vivante de nos différentes sociétés. La communauté internationale (gouvernements, organismes) ressent un besoin grandissant de sauvegarder ce patrimoine et de démocratiser l'accès de celui-ci. Les intérêts sont nombreux, nous pouvons citer quelques domaines : l'enseignement, l'industrie du tourisme, les médias ...
C'est ici qu'intervient le projet NaviDoMAss qui a pour mission de mettre en valeur différents biens du patrimoine international et plus particulièrement les ouvrages, les collections d'images et autres documents iconographiques. A court terme, ces nombreux documents constitueront une source gigantesque d'information (masse de données). L'objectif de ce projet est de contribuer à la réalisation de systèmes d'indexation d'images de document du patrimoine. Ce projet s'inscrit ainsi dans la volonté actuelle de préserver le patrimoine culturel et scientifique et d'assurer au plus grand nombre l'accès à ce patrimoine.
Problématiques
Considérant la grande quantité d'information à stocker, il est nécessaire de se pencher sur certains problèmes :
- Tout d'abord la consultation en mode image des documents patrimoniaux suppose leur archivage et exige donc d'examiner de manière approfondie les possibilités spécifiques de compression de ces masses de documents.
- Se pose aussi le problème de simplifier au maximum la recherche d'un document. L'idée est de déterminer des indices s'adaptant aux différentes représentations de l'information que l'on peut rencontrer dans les documents patrimoniaux comme des zones textuelles, des images, des illustrations graphiques. Ces indices apportent des connaissances spécifiques qui aideront à la navigation.
- Enfin, il est important de souligner que certains facteurs (culturels, sociaux ou économiques) risquent toutefois d'empêcher d'exploiter pleinement le potentiel de ces ressources, du moins dans un premier temps. C'est pour ces raisons que ce projet vise aussi et en outre à renforcer les actions de sensibilisation sur les problèmes de conservation des données et par conséquent à générer des investissements et à établir une politique européenne commune sur l'utilisation du contenu culturel déjà numérisé.
Groupes de travail
Les différents laboratoires sont rassemblés autour de groupes de travail
Groupe de Travail |
Thème
|
Laboratoires participants |
---|---|---|
0 |
Management du projet
|
L3i / LI |
1 |
Les besoins utilisateurs, conception
collaborative et vérité terrain
|
CESR / L3i |
2 |
Analyse des couches des documents et indexation
basée sur la structure
|
LITIS / LI |
3 |
Recherche d'informations
|
LI / LITIS / Loria |
4 |
Structurer l'espace d'information
|
LORIA / L3i |
5 |
Extraction et contrôle interactifs
|
LI / L3i / Loria |