Agropolis

INDEXATION (indexing) :
Quelques définitions

GESIST 2002 : 27/09/02
Hanka Hensens, IRD : hanka.hensens@ird.fr

Ce type d’analyse conduit à la transcription du contenu d’un document en mot clés, descripteurs ou vedettes matière,... issus du langage naturel ou d’un langage ou vocabulaire contrôlé .

L’indexation peut être de trois niveaux (elle doit alors donner lieu à trois champs) :

L’indexation géographique est un cas particulier de l’indexation matière.
Elle peut être dissociée ou fusionnée dans les mêmes champs que ceux de l’indexation matière.

L’indexation peut être automatique : elle est alors le résultat du traitement par un programme du texte intégral, soit en versant directement dans un index tous les mots ou groupes de mots significatifs du texte, après en avoir éliminé les mots vides, soit en
analysant ces différents mots ou groupes de mots, pour gérer les problèmes grammaticaux et sémantiques du langage naturel (ce dernier type de logiciel est encore expérimental, et hors de prix pour de petites structures).
En effet, 'indexation automatique génère encore beaucoup de bruit et doit être pondérée par une analyse statistique, linguistique, cartographique ou relationnelle, ou complétée par... une relecture ou indexation humaine !

Quelques définitions de termes proches mais non équivalents :

MOT CLE (keyword)

Mot ou groupe de mots choisi en vu de représenter le contenu d’un document, et de le retrouver lors d’une recherche documentaire. Il peut être issu du document (titre, texte, résumé,...) ou d’un vocabulaire contrôlé.

DESCRIPTEUR (descriptor)

Mot clé choisi parmi un ensemble de termes équivalents pour représenter sans ambiguïté un concept.
Il fait en général partie d’un vocabulaire organisé et hiérarchisé de type "thésaurus".

CANDIDATS (descripteurs, mots clés, ou vedette matière)

Terme choisi en dehors des outils d'indexation, dans le cas ou un/des concept(s) important(s) du document ne peuvent être rendus par ceux proposés par les outils.
Cette proposition aura avantage à être entrée dans un champs à part qui sera indexé informatiquement régulièrement pour :

VEDETTE MATIERE (subject heading)

Mot clé général utilisé en bibliothèque pour caractériser le contenu d’un document et pour classer sa référence bibliographique.
C'est un degré intermédiaire entre classification et indexation : chaque document n’est caractérisé que par un très faible nombre de vedette matière).