Le vocabulaire partagé par des sous-groupes d'une communauté
Sankoff, David
Mathématiques et Sciences humaines, Tome 124 (1993), p. 41-47 / Harvested from Numdam

On propose un indice de vocabulaire partagé γ afin d'évaluer les ressemblances et les différences entre les ensembles de mots utilisés dans deux sous-groupes d'une communauté. Cet indice mesure la différence entre le nombre moyen de mots partagés par deux locuteurs, l'un dans le premier groupe, l'autre dans le deuxième et le nombre prédit par une hypothèse nulle basée sur une distribution globale de la fréquence des mots. La formulation de γ permet des variations dans la taille de l'échantillon lexical d'un locuteur à l'autre. On présente la formule pour la variance de γ sous l'hypothèse nulle. Une application de l'indice à des données sur les emprunts à l'anglais dans le français parlé à Ottawa-Hull nous aide à comprendre l'utilisation de ces emprunts à l'intérieur des différents groupes d'âge.

An index of sharedness γ is proposed for evaluating how similar or different are the lexical stocks of two subgroups of a larger comunity. This index measures the average number of words common to the vocabulary of two speakers, one in the first group, and on in the second, in excess of (or less than) the number predicted by a null hypothesis based on a global word-frequency distribution. The formula for γ alows the size of the vocabulary sample to vary from speaker to speaker. An expression is found for the variance of γ under the null hypothesis. Applying the index to data on borrowings from English in Ottawa-Hull French leads to an understanding of the use of loanwords among different age groups.

Publié le : 1993-01-01
@article{MSH_1993__121__41_0,
     author = {Sankoff, David},
     title = {Le vocabulaire partag\'e par des sous-groupes d'une communaut\'e},
     journal = {Math\'ematiques et Sciences humaines},
     volume = {124},
     year = {1993},
     pages = {41-47},
     zbl = {0784.92031},
     language = {fr},
     url = {http://dml.mathdoc.fr/item/MSH_1993__121__41_0}
}
Sankoff, David. Le vocabulaire partagé par des sous-groupes d'une communauté. Mathématiques et Sciences humaines, Tome 124 (1993) pp. 41-47. http://gdmltest.u-ga.fr/item/MSH_1993__121__41_0/

Poplack S., "Conséquences linguistiques du contact des langues : un modèle d'analyse variationniste", Langage et société, 43, 1988, 23-48.

Poplack S., Sankoff, D., Miller, C., "The social correlates and linguistic processes of lexical borrowing and assimilation" Linguistics, 26, 1988, 47-104.