Agropolis

BRUIT ET SILENCE
GESIST 2002 : 27/09/02
Hanka Hensens, IRD : hanka.hensens@ird.fr

 

L’Indexation a pour but de retrouver le document lors d’une recherche documentaire thématique pertinente, qui évite au maximum les deux écueils du bruit et du silence.

Le silence

Documentairement parlant, c’est l’ensemble des documents pertinents non affichés lors d’une recherche documentaire.
C’est le plus grave des problèmes car il est indétectable pour celui qui interroge qui peut croire qu’il a en main toutes les réponses.

Il peut être causé par une indexation automatique, une indexation trop pointue, des fautes de frappe ou l’emploi de synonymes (par exemple, programme, logiciel, application informatique employés alternativement dans différentes références) ou de plusieurs mots de la même famille.

Il peut être combattu, lors de l’interrogation, si l'on s'étonne du faible nombre de réponses, par la combinaison, par "OU" ("OR"), de nombreux synonymes ou par l’emploi de thèmes plus généraux, ou de chapitres du plan de classement.

Le bruit (noise)

En documentation, c’est l’ensemble des documents non-pertinents affichés suite à une recherche documentaire.

On a coutume de dire qu’en documentation, le bruit vaut mieux que le silence, puisque l’utilisateur peut ensuite trier parmi les réponses obtenues celles qui l’intéressent.
Cependant, le bruit peut être un facteur de découragement pour les utilisateurs occasionnels, et de perte de temps pour tous.

Il peut être dû à une indexation automatique, à une indexation humaine trop prolixe (surindexation), ou à l’emploi de descripteurs polysémiques (par exemple : avocat, pour traiter du fruit et de la profession), trop flous ou trop généraux.
La polysémie, gênante dans une base encyclopédique, l’est beaucoup moins dans une base clairement spécialisée.

Comme le silence, il peut être contré, lors de l’interrogation, par la réduction de l’ensemble des réponse par "ET" ("AND") ou "SAUF" ("NOT"), ou des opérateurs de proximité ("NEAR")

Les meilleurs remèdes au bruit comme au silence sont, lors de l’indexation, le choix de descripteurs du niveau de spécialisation du document et de la base de donnée, et par l’utilisation, lors de l’indexation ET de l’interrogation des outils énumérés au chapitre outils.
A défaut d’outils complexes, l’utilisation régulière d’index, et le respect de quelques règles simples sont indispensables.