On propose ici un modèle de description du vocabulaire employé dans un corpus ; il est partagé en deux groupes : un vocabulaire général employé quelles que soient les circonstances et des vocabulaires locaux (ou "spécialisés") dont chacun est mobilisé dans une partie seulement du corpus. Les vocables généraux peuvent apparaître en n'importe quel point du texte et leur accroissement, en fonction de la taille du corpus, peut être estimé grâce à la formule de Muller. Dans le modèle, un paramètre de partition estime le poids relatif des deux vocabulaires : la valeur de ce paramètre donne donc une estimation de la spécialisation lexicale à l'œuvre dans le corpus. Des applications de ce modèle sont conduites sur l'œuvre de Racine et sur des débats télévisés (Giscard-Mitterrand et Chirac-Fabius), Le modèle de partition peut être également utilisé pour calculer l'accroissement du vocabulaire dans un corpus, pour y localiser des variations stylistiques ou pour comparer pusieurs textes du point de vue de leur "richesse de vocabulaire".
Publié le : 1988-07-05
Classification:
statistics,
vocabulary,
vocabulary increase,
vocabulary specialisation,
vocabulary richness,
statistique,
linguistique,
vocabulaire,
specialisation du vocabulaire,
diversité du vocabulaire,
richesse du vocabulaire,
[MATH.MATH-ST]Mathematics [math]/Statistics [math.ST],
[STAT.TH]Statistics [stat]/Statistics Theory [stat.TH],
[SHS.LANGUE]Humanities and Social Sciences/Linguistics
@article{hal-00758061,
author = {Hubert, Pierre and Labb\'e, Dominique},
title = {Un mod\`ele de partition du vocabulaire},
journal = {HAL},
volume = {1988},
number = {0},
year = {1988},
language = {fr},
url = {http://dml.mathdoc.fr/item/hal-00758061}
}
Hubert, Pierre; Labbé, Dominique. Un modèle de partition du vocabulaire. HAL, Tome 1988 (1988) no. 0, . http://gdmltest.u-ga.fr/item/hal-00758061/