Format du fichier SP402.TXT

Le fichier SP402.TXT constitue la liste hiérarchisée des descripteurs du thesaurus santé publique version 4.02 (TSP4 en abrégé). Il s'agit d'un fichier informatique destiné à être importé dans un logiciel documentaire.

Caractéristiques de TSP4

TSP4 est un thesaurus monolingue, en français uniquement. C'est un thesaurus mono-hiérarchique : chaque terme a au maximum un parent.

Il contient un total de 12 825 termes organisés en 57 micro-thesaurus : 7 144 descripteurs et 5 681 synonymes (non-descripteurs).

Format du fichier

Chaque terme, qu'il s'agisse d'un descripteur ou d'un non-descripteur, apparaît sur une ligne et est suivi de plusieurs lignes décrivant le terme.

Les lignes de description commencent par un espace suivi immédiatement d'un code sur deux lettres indiquant la nature de l'information donnée.

Les codes utilisés sont les suivants :

  • EM : employer xxx : le terme considéré est un non-descripteur, xxx est le nom du descripteur correspondant.
  • EP : employé pour xxx : le terme considéré est un descripteur employé à la place du non descripteur xxx.
  • MT : numéro du micro-thesaurus auquel est rattaché le terme considéré (numéro sur 2 chiffres de 01 à 57).
  • NA : note d'application : phrase expliquant dans quel contexte le terme considéré peut être utilisé.
  • TA : terme associé : indique une relation "voir aussi" pour le terme considéré.
  • TG : terme générique : indique le parent immédiat du terme considéré.
  • TS : terme spécifique : indique un fils immédiat du terme considéré.

Remarque

Certains descripteurs sont suffixés de la mention [NI] qui signifie "non indexable/non interrogeable".

Il s'agit de termes qui, bien que considérés techniquement comme des descripteurs (parce qu'ils ont des termes spécifiques) doivent être considérés comme des non-descripteurs vis-à-vis de l'utilisateur.

Il s'agit en fait de "noeuds" intermédiaires dans l'arbre, créés pour regrouper au sein d'une même branche des termes qui n'auraient pas pu l'être sinon.

Extrait du fichier

Vous pouvez décharger un extrait du fichier, contenant les 30 premiers termes.