Vous êtes ici : Accueil > Gestion > Le fonds > Classification, langage documentaire et indexation
Publié : 10 septembre 2007
Format PDF Enregistrer au format PDF

Classification, langage documentaire et indexation

Les catalogues informatisés des établissements scolaires doivent répondre aux critères de pertinence (respect des normes, renseignement de tous les champs du bordereau de saisie, adéquation entre le fonds documentaire informatisé et les exemplaires présent au CDI...) en prenant en compte les attentes des élèves, des enseignants ; cela suppose une collaboration réussie entre enseignants de discipline et enseignants documentalistes : politique d’acquisition commune, communication des thèmes de recherche données aux élèves...

Les choix de tel ou tel système de classification (CDU/DEWEY), des langages documentaires, souvent liés au choix du logiciel de gestion (Motbis pour BCDI, Rameau (Répertoire d’Autorités Matières Encyclopédique Alphabétique et Unifié utilisé BU, BPI, BM) , Thésaurus de l’Unesco pour PMB...) résultent d’une politique d’indexation de l’établissement qui doit garantir la cohérence des descriptions au sein de la base documentaire et la mise en conformité des besoins des usagers et du traitement documentaire effectué par les professeurs documentalistes.

Il faut donc bien réfléchir aux conséquences et à l’intérêt d’un changement de système de classification ou de logiciel documentaire dans un CDI ; ce choix ne peut, en aucun cas, émaner d’un choix personnel.

CDU ou DEWEY ?

Les classifications DEWEY ou CDU permettent non seulement de retrouver les documents dans le CDI mais permettent l’indexation systèmatique des documents :

- Définition, principe de cotation à consulter sur : Savoirs CDI

- description détaillée de la CDU

- description détaillée de la classification Dewey

Les langages documentaires

Un outil d’indexation : le Thésaurus

« Du point vue de de sa fonction, un thésaurus est un instrument de contrôle de la terminologie utilisé pour transposer en un langage plus strict (langage documentaire, langage d’information) le langage naturel employé dans les documents et par les indexeurs ou les utilisateurs. Du point de vue de sa structure, le thésaurus est un vocabulaire, contrôlé et dynamique, de termes ayant entre eux des relations sémantiques et génériques et qui s’applique à un domaine particulier de la connaissance » (Chaumier, 1988).

« Langage documentaire fondé sur une structuration hiérarchisée d’un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes d’une ou plusieurs langues naturelles et les relations entre notions par des signes conventionnels ». (AFNOR, 1987)

Avec l’interrogation des moteurs de recherche en langage naturel, la question de la légitimité des thésaurus est souvent posée, le recours au thésaurus apparaît parfois dépassé, trop complexe, trop rigide...
En réalité, il n’en est rien : les thésaurus de toute sorte fleurissent : certains moteurs de recherche en ligne commencent à intégrer la recherche sur des thésaurus :
- Exploredge : Développé par Jean-luc Besset, Exploredge fonctionne avec Google,Yahoo, Msn, Alletheweb, Ask, exalead, wikipedia, AOL.
L’utilisateur, en lançant sa recherche, se voit proposé - si son mot-clé est présent dans l’un des thésaurus implémenté dans le logiciel- une fenêtre juxtaposée à la page de résultats qui permet de recontextualiser sa requête dans un univers sémantique précis en proposant une hiérarchisation des termes - principe du thésaurus.

Le thésaurus, outil d’indexation et de recherche permet d’éliminer :
les ambiguïtés du langage naturel, liés au termes polysémiques par exemple, de préciser une problématique et par voie de conséquence de trouver des documents pertinents, intérêts non négligeables pour lutter contre l’infopollution.


Quelques thésaurus en ligne :

- Motbis - Version 2006 du thésaurus de l’Education nationale (France) élaboré par le CNDP et le réseau SCÉRÉN. 18 040 termes organisés en 69 microthésaurus (terminogrammes) : Motbis consultable en ligne

- 
RAMEAU
- Répertoire d’autorité-matière encyclopédique et alphabétique unifié. Version Juillet 2004. Equivalent en anglais. Edité par la Bibliothèque nationale de France. Parmi l’ensemble des vedettes, environ 88 462 noms communs et 46 616 noms géographiques. Consultable en ligne. :Rameau consultable en ligne

- Thésaurus de l’UNESCO en ligne :version française du thésaurus de l’Unesco. 8.600 termes en français. Edité par l’Unesco. Disponible en ligne et sur cédérom. Un index trilingue est également accessible sur le site University of London Computer Centre, en collaboration avec l’UNESCO

- Terminologie de base en sciences de l’information en ligne

- Thésaurus en éducation pour la santé

Conseil pour compléter le champ des descripteurs des logiciels de gestion documentaire :

Ne pas utiliser ensemble des descripteurs se trouvant à des niveaux différents dans une même chaîne hiérarchique mais possibilité de capturer les termes associés. L’autopostage interroge la chaîne hiérarchique :

L’autopostage permet, à partir d’un terme générique, d’accéder automatiquement à tous les termes spécifiques (autopostage descendant) ou, à partir d’un terme spécifique, de remonter aux termes génériques (autopostage ascendant).

Références pour aller plus loin :

- Tableau comparatif des principaux langages documentaires

- Se référer à la norme AFNOR Z47-100 : principes généraux pour l’indexation des documents

Consulter les ouvrages de :

- Feyler, François. L’analyse documentaire : résumer, indexer... CRDP de Poitou-Charentes, 1995.

- Chaumier, J. (1988). Le traitement linguistique de l’information. 3e éd.mise à jour et augmentée. Paris : Entreprise Moderne d’Édition.

L’indexation des ressources en ligne

Avec la mise en ligne des informations (sites web des établissements scolaires, pages CDI...en particulier), la question de l’indexation se pose à plus d’un titre : d’une part, une indexation réussie permet un meilleur référencement d’une ressource web par un moteur de recherche et une facilité d’accès à des contenus de toute sorte (textes, sons, images aux formats multiples), d’autre part, créer des notices descriptives selon les recommandations du Dublin Core permettrait d’assainir le contenu des ressources d’information sur internet en apportant aux usagers la possibilité de trouver une ressource d’information plus pertinente et ainsi de lutter contre « l’ infopollution » (terme utilisé par Joël de Rosnay, Directeur de la Prospective et de l’Evaluation, dans un entretien de Sacha Goldman, Transversales, Science Culture, Nouvelle série n°1, Mai 2002)
« La norme de métadonnées du Dublin Core est un ensemble d’éléments simples mais efficaces pour décrire une grande variété de ressources en réseau. La norme du Dublin Core comprend 15 éléments ( titre, auteur, format...) dont la sémantique a été établie par un consensus international de professionnels provenant de diverses disciplines telles que la bibliothéconomie, l’informatique, le balisage de textes, la communauté muséologique et d’autres domaines connexes ».

Guide Dublin Core

Les principes de catalogage :

Définition

Le catalogage est la description physique du document ; les données bibliographiques figurant sur la première, page titre, quatrième de couverture... sont prélevées pour compléter les champs du bordereau de saisie du logiciel documentaire : titre, mention de responsabilité, mention d’édition, collation....

Les normes

L’ISBD (International Standard Bibliographic Description, Description bibliographique
internationale normalisée en français) fixe les normes de catalogage sur la plan international : les pavés ISBD permettent de fournir le maximum d’informations descriptives nécessaires à toutes les activités bibliographiques ; ils comprennent donc des éléments qui sont essentiels à une ou à plusieurs de ces activités, mais pas nécessairement à toutes :
1. Zone du titre et de la mention de responsabilité
2. Zone de l’édition
3. Zone particulière à certains types de documents (ou à certaines catégories de publications)
4. Zone de la publication, distribution, etc.
5. Zone de la description matérielle
6. Zone de la collection
7. Zone de notes
8. Zone du numéro normalisé (ou autre numéro) et des modalités d’acquisition (exemple : prix)

La BNF propose une traduction des normes ISBD éditées par l’IFLA (International Fédération of Library Associations and Institutions) :

En France, l’AFNOR reprend les normes de descriptions bibliographiques fixées par l’ISBD

Ressources :

Vocabulaire de la documentation INTD-ER. Ouvrage coordonné par Arlette Boulogne
Sciences et techniques de l’information (ISSN 1762-8288) 2004 - 334 pages - ISBN 2-84365-071-2
Recueil de normes de catalogage édité en 2005 par l’AFNOR
ISBN 2-12-484450-4 (collection complète)
Prix : 216,75 € HT - 228,67 € TTC (les 3 volumes)

- Le site Savoirs CDI

Description d’un contenu

La description de contenu regroupe l’ensemble des opérations par lesquelles on décrit le contenu de l’Unité Documentaire : résumé, analyse, indexation, analyse de citations, extraction...

Le résumé

La norme Z44-004 fixe les règles d’élaboration du résumé.
Il est conseillé de rédiger :
- un résumé indicatif pour les documentaires : " Présentation abrégée du contenu d’un document, ne signalant généralement que le ou les thèmes abordés. " (AFNOR)
- incitatif pour les fictions :
en veillant à :
- ne pas émettre de jugement critique,
- éviter de noter des informations sur la forme du document, privilégier l’indexation du champ « nature »
- ne pas réutiliser des descripteurs du thésaurus mais au contraire d’indiquer des termes que le thésaurus ne permet pas.

Quelques conseils pour assainir sa base

Quelques conseils pratiques de saisie des notices des logiciels documentaires :

- Un guide complet de saisie à consulter

- Quelques équations utiles pour parfaire la cohérence de sa base