Queen's University at Kingston

[Niveau supérieur | QLink ]

Chapitre 6: La lexicologie

Pour des renseignements de base, mettez le curseur sur l'une des lignes suivantes et cliquez avec la souris ou faites un retour de chariot. Notez que le texte peut aussi être lu de façon suivie.

Qu'est-ce que c'est que la lexicologie?

Après la phonétique et la phonologie, qui s'occupent des sons, et la morphologie qui s'occupe des unités minimales de forme et de sens, nous arrivons dans la lexicologie, qui s'occupe des masses de mots qui forment le lexique d'une langue, et le stock lexical des individus. Nous verrons que la notion même de mot est assez complexe, et que l'étude des mots demande des procédures assez fines.

Pour saisir l'importance de la lexicologie, il vaut la peine de réfléchir sur nos capacités de manipulation lexicale. Chaque locuteur d'une langue possède des milliers de mots. Certains de ces mots sont utilisés tous les jours, mais d'autres n'apparaissent pas dans la bouche ou sous le stylo qu'une ou deux fois par année. Malgré cela, nous arrivons à trouver les mots qu'il nous faut dans un instant, sans même y faire attention. Il y a donc une question de stockage et d'accès qu'il faut examiner.

Mais avant même d'analyser les mots de la langue, il faut commencer par préciser ce qu'on étudie. Qu'est-ce que c'est qu'un mot?

Début.


Définitions de l'unité lexicale

Il faut commencer par noter que la notion de mot est assez floue. Par exemple, combien de mots y a-t-il dans chacun des exemples suivants?
  1. le tableau est contre le mur
  2. un petit stylo sur une petite table
  3. je lis le livre que tu lisais hier
  4. je lirai le livre que tu as lu hier
  5. je le vois, le stylo bleu
  6. dans le bois, sur une chaise de bois, je bois de l'eau
En (1), certains locuteurs diraient qu'il y a 6 mots, tandis que d'autres diraient qu'il y en a 5 (en comptant comme un seul mot les deux fois qu'on trouve le). On voit donc qu'il faut faire une distinction préliminaire entre ce qu'il y a physiquement (ce qu'on appelle les occurrences) d'une part, et d'autre part les formes, c'est-à-dire les unités formelles, qui peuvent apparaître plus d'une fois. Ainsi, en (1), on trouve 6 occurrences, mais deux d'entre elles sont des occurrences d'une seule forme le.

Exercice: Combien de formes et d'occurrences y a-t-il dans les suites:
  1. ma tasse est sur ma table,
  2. mets le cahier dans le livre contre le mur.

En (2), la situation se complique davantage. Certains locuteurs diraient qu'il y a 7 mots dans la suite, tandis que d'autres y verraient 5. Les premiers comptent les occurrences, tandis que les autres mettent ensemble un et une, d'une part, et petit et petite d'autre part. On voit qu'il faut faire une deuxième distinction: on peut analyser certaines formes comme des manifestations d'un même lexème. Ainsi, il existe un lexème PETIT, une classe abstraite, qui possède quatre formes possibles à l'écrit ( petit, petits, petite, petites) et deux formes à l'oral ([p ti], [p tit]), et chacune de ces formes peut avoir une ou plusieurs occurrences dans un texte.

Notons que la répartition des formes en lexèmes n'est pas toujours évidente. Par exemple, s'il est facile de voir que deux formes comme table et tables représentent le même lexème, et qu'il en va de même pour les adjectifs, l'identité des articles soulève des problèmes. Est-ce qu'on considère comme relevant d'un même lexème un et une? Si oui, faut-il les mettre ensemble avec des, qui serait leur forme plurielle? Faut-il combiner dans un seul lexème les différentes formes de l'adjectif possessif mon, ton, son, ma, ta, sa, mes, tes, ses? Et à un niveau plus général, faudrait-il mettre ensemble toutes les formes du déterminant dans un seul lexème?

Il n'y a pas une seule réponse correcte à cette question. Tout ce qu'on peut faire est de préciser clairement ses définitions, et de les respecter par la suite. Mais revenons à nos exemples.

En (3), on voit la présence de deux formes distinctes d'un même verbe. Il y a donc 8 occurrences dans l'exemple, et 8 formes, mais il y a 7 lexèmes (si on met ensemble lis et lisais et si on sépare je et tu).

L'exemple (4) ajoute une autre complication. Faut-il traiter comme une seule forme lirai et as lu? Pour justifier un tel choix, on pourrait arguer que as lu n'est qu'une autre forme du verbe. Pour justifier le contraire, on pourrait signaler qu'il est possible de diviser as lu (ex. tu n'as pas lu le livre).

En (5), il s'ajoute encore une autre complication. On trouve deux occurrences de le, mais s'agit-il de la même forme? La plupart des linguistes diraient que non, puisque la première occurrence représente l'article le, tandis que la deuxième occurrence représente le pronom le.

Par contre, en (6) on voit qu'une telle division n'est pas toujours simple. On y trouve 3 occurrences de bois. Dans un cas, il semble clair qu'on a un lexème distinct: la troisième occurrence est un verbe, donc une forme du lexème BOIRE. Par contre, dans les deux premières occurrences, on a des noms. Le problème vient du fait que le sens des deux noms n'est pas identique. Dans le premier, il s'agit de `forêt' et dans le deuxième, de `matière'. Certains linguistes y verraient deux lexèmes, d'autres un seul.

Pour conclure, on voit que le terme mot est dangereusement flou. Dans la suite, nous parlerons d'occurrences de formes et de lexèmes, tout en retenant le fait que les distinctions ne sont pas toujours faciles à faire.

Début.


Lexique et vocabulaire

Il existe deux lieux d'existence pour les unités lexicales. D'un côté, pour désigner les unités lexicales utilisées et comprises par un individu, nous utilisons le terme de vocabulaire. Chaque individu a son vocabulaire à lui, qui fait partie de son idiolecte, sa façon individuelle de s'exprimer.

En même temps, tous les locuteurs qui parlent une même langue partagent une masse d'unités lexicales. Aucun locuteur ne possède toutes, mais ensemble, leurs vocabulaires combinés définissent une unité supérieure qui existe au niveau de la communauté: nous l'appelons le lexique.

Début.


Vocabulaire passif et vocabulaire actif

Les locuteurs d'une langue possèdent chacun deux façons d'utiliser leur vocabulaire. Il existe des unités lexicales qu'ils utilisent (qu'ils prononcent ou qu'ils écrivent). Certaines de ces unités sont employées tous les jours (ex. le, je, être), tandis que d'autres sont utilisées plus rarement. Par exemple, pensez à la dernière fois que vous avez utilisé le mot fourchette. Le vocabulaire qu'on utilise dans la parole et dans l'écriture s'appelle le vocabulaire actif. Il est clair que le vocabulaire actif d'un individu change avec le temps. On apprend des mots nouveaux (ou on en fabrique au moyen des mécanismes de créativité lexicale) et on les utilise. En même temps, il existe des mots qu'on laisse de côté, soit parce qu'ils sont passés de mode, soit parce qu'ils appartiennent au parler d'une autre couche d'âge.

Exercice:
  1. Trouvez des mots que vos grands-parents ou vos parents utilisent, mais que vous n'utilisez plus (sauf peut-être quand vous leur parlez). Quels sont les termes qui les remplacent dans votre vocabulaire?
  2. Trouvez 10 mots français que le dictionnaire catégorise comme `vieillis'. Trouvez 10 mots (dans un magazine ou un journal, par exemple) qui sont courants en français aujourd'hui, mais qui n'étaient pas attestés en 1980.

À côté de son vocabulaire actif, chaque locuteur possède aussi un vocabulaire qu'il ou elle comprend, sans l'utiliser pour la production. On parle alors de vocabulaire passif. Les limites du vocabulaire passif sont aussi difficiles à mesurer, pour plusieurs raisons. D'abord, le fait de posséder des mécanismes de créativité lexicale donne à chaque locuteur la possibilité de comprendre des mots nouveaux.

En principe, vous seriez capable de comprendre n'importe quel mot nouveau en non- ou en re-. Plus sérieusement, la notion même de comprendre est assez floue. Voyons les exemples suivants:

  1. fauve
  2. Les fauves se trouvent dans la nature et dans les zoos.
  3. libellule
  4. Les libellules, avec leurs quatre ailes transparentes, se nourrissent d'insectes.
Même si les formes fauve et libellule ne sont pas comprises hors contexte (exemples (1), (3)), il existe des contextes qui les rendent compréhensibles, à des degrés variables (exemples (2), (4)). Très souvent, dans la conversation et dans les lectures, on saisit le sens de mots nouveaux par le contexte: ces mots passent ainsi dans le vocabulaire passif.

Exercice: Trouvez trois mots à l'écrit ou à l'oral, que vous comprenez partiellement. Utilisez chaque mot dans trois phrases. Ensuite, cherchez la définition du mot dans un bon dictionnaire. Comparez la définition avec votre compréhension du mot telle que représentée dans les phrases.

Début.


Les corpus

Ni le vocabulaire d'un individu, ni le lexique d'une langue n'est directement accessible dans toute son étendue. Si on veut travailler sur les masses d'unités lexicales, il faut trouver une autre clé d'accès. L'une des plus importantes consiste en l'utilisation de corpus. Un corpus est une collection de productions linguistiques qui se ressemblent par leur origine. Ainsi, au niveau de l'écrit, un roman de Camus formerait un corpus. De même, tous les romans de Camus formeraient un autre corpus, qui engloberait le premier. Et tous les romans français produits au XXième siècle formeraient un corpus même plus gros.

Au niveau oral, une conversation pourrait former un corpus, un ensemble de conversations dans les mêmes circonstances formeraient un autre, et ainsi de suite.

Il existe pour le français plusieurs corpus importants. Au niveau écrit, le Dictionnaire des fréquences du Trésor de la langue française fournit des données sur un corpus important de textes français du XIXième et du XXième siècles. Au total, ce corpus comprend plus de 70,000,000 d'occurrences (32,663,549 occurrences pour le XIXième et 37,653,685 occurrences pour le XXième siècle).

Pour le français parlé, le Français fondamental, basé sur 275 conversations, comprend 312,135 occurrences divisées entre 7995 formes.

Le nombre d'occurrences d'une forme donnée dans un corpus s'appelle sa fréquence absolue. Pour obtenir la fréquence absolue d'un lexème, on additionne la fréquence de ses différentes formes. Lorsqu'on analyse un corpus selon les fréquences absolues, on constate un certain nombre de relations.

Premièrement, les mots les plus fréquents sont tirés des mots outils à fonction grammaticale (les déterminants, les prépositions, les conjonctions, les auxiliaires). Les noms, les verbes et les adjectifs occupent les fréquences plus basses. En fait, un très petit nombre de mots grammaticaux représentent une très grande proportion d'un texte.

Deuxièmement, on remarque que la longueur des mots a tendance à diminuer au fur et à mesure que la fréquence monte. Les mots les plus fréquents ont tendance à être très courts. Pensez à des formes comme le, et, à, de. Cela représente une tendance à l'économie.

Troisièmement, on remarque que les formes irrégulières se regroupent dans les hautes fréquences. Ainsi, dans les verbes français, les conjugaisons irrégulières se trouvent parmi les verbes usuels comme être, avoir, faire, aller, pouvoir, vouloir, etc.. Encore une fois, l'explication est simple: parmi les formes irrégulières, qui par définition sont plus difficiles à retenir que les formes régulières, seules les formes fréquentes ont tendance à rester en mémoire et à être renforcées par un usage constant.

Exercice: Quels sont les 5 mots les plus fréquents dans le Trésor de la langue française? Dans un petit corpus de quelques pages, vérifier si les mêmes mots se présentent dans les plus fréquents.

Début.


La disponibilité

Nous avons déjà vu qu'il existe des unités lexicales qu'on utilise constamment (les déterminants, prépositions, conjonctions, auxiliaires, etc.). Leur fréquence relative varie assez peu d'un corpus à l'autre. Par contre, la fréquence des noms, verbes et adjectifs a tendance à varier considérablement selon le domaine où on a relevé le corpus. Ainsi, on a peu de chances de trouver une forme comme allomorphe dans un livre de recettes, tout comme on a peu de chances de trouver une forme comme rissoler dans un manuel d'informatique.

Tout cela se reflète dans la vie de tous les jours. Il existe des mots qu'on utilise assez peu souvent, qui dépendent d'une situation appropriée pour qu'on les utilise. Pensez à la dernière fois que vous avez utilisé les formes grille-pain, tracteur, plage. Afin de mesurer l'importance relative de ces formes, on a tendance à regarder au-delà des corpus et à utiliser d'autres outils, comme des tests par association. Par exemple, on donne un domaine (la cuisine, par exemple) à un groupe de locuteurs, et on leur demande d'écrire les 10 ou les 20 premiers mots qui leur viennent à l'esprit. (Voir Gougenheim 1967, Fortier 1993 pour des exemples.)

Les résultats d'un tel test nous permettent de mesurer ce qu'on appelle la disponibilité des unités lexicales, ou en d'autres termes, leur capacité à être rappelées par les locuteurs. En même temps, un test comme cela nous indique les micro-systèmes lexicaux, les unités qui ont tendance à se manifester ensemble. Dans le domaine de la cuisine, les micro-systèmes comprennent entre autres choses fourchette, couteau et cuiller, table et chaise, et tasse et soucoupe.

Expérience: Choisissez un domaine et tester la disponibilité des mots du domaine. Êtes-vous capable de prédire les résultats sur la base de votre intuition linguistique?

Début.


L'économie du lexique

Économie est employé ici avec le sens `l'organisation des divers éléments d'un ensemble; la relation entre ces éléments.'

L'emprunt

Les locuteurs d'une langue emploient (empruntent) souvent un élément d'une autre langue, par paresse, par euphémisme, ou à cause d'une mode qui fait valoriser cette langue. De là l'emploi de mots anglais comme les suivants en français:

Dans d'autres cas, une idée innovatrice ou un objet nouveau est emprunté avec le nom qui le désigne.

De là les mots `français' suivants:

Ces mots d'origine étrangère s'appellent des emprunts (ou mots d'emprunt).

Exercice: Trouvez d'autres exemples de mots d'emprunt en français. Est-ce que le français possède déjà un mot pour l'objet ou l'idée représenté? Proposez une raison pour l'emprunt.

Dans plusieurs régions de la francophonie, on s'inquiète au sujet des emprunts à l'anglais. On peut lire dans les journaux des réactions très fortes contre ce `danger'. Mais pour bien évaluer l'effet de l'anglais sur le français, il nous faut des mesures quantitatives. Quel serait le pourcentage des emprunts? Est-ce que ce pourcentage varie selon la partie du discours (les noms versus les verbes), selon la communauté (la France versus le Canada), la modalité (l'oral versus l'écrit), ou le domaine (les sports versus les finances)? On n'examine de telles questions de façon rationnelle que depuis peu de temps.

Exercice 1: Prenez une page d'un journal francophone et calculez le pourcentage des emprunts à l'anglais, ainsi que la partie du discours de chaque emprunt. Utilisez comme critère le fait que la forme n'existe pas dans un dictionnaire du français, mais qu'elle existe dans un dictionnaire anglais.

Exercice 2: Quelles pourraient être les objections à l'emprunt?

Début.


Les relations entre les classes grammaticales

Nous avons vu que les locuteurs peuvent créer, par la suffixation, un adjectif à partir d'un nom ou un nom à partir d'un verbe etc. (planète, planétaire; blesser, blessure). En conjonction avec d'autres méthodes de création, la suffixation permet de créer des familles de mots. Regardons quelques exemples:

chanter chant
chanteur, chanteuse
diphtongue diphtonguer
diphtongaison
diplomate diplomatie
diplomatique
diplomatiquement
frais/fraîche fraîcheur
fraîchement
rafraîchir
rafraîchissant
rafraîchissement
mérite mériter
méritoir
méritocracie
merde merdeux
emmerder
emmerdé

Exercice: Trouvez deux `familles de mots'. Expliquez les relations entre les mots individuels. Attention! Quelquefois, les mots se ressemblent sans avoir (du moins en français) une relation de parente. Par exemple, diplôme, diplômer ressemblent à diplomate, diplomatique etc., mais la relation entre les deux groupes est seulement étymologique.

Début.


Les homophones et les homonymes

Parmi les relations importantes entre éléments du texique, nous constations l'existence d'un nombre considérable d'homophones et d'homonymes.

Un homonyme est un mot qui est identique à un autre quant à sa structure phonologique, quant à ses fonctions dans le discours, et quant aux traits majeurs affectant son insertion dans la phrase.

Les paires suivantes sont constituées de deux homonymes:

coup m `choc physique' cou m `partie du corps'
faim f `besoin de manger' fin f `bout, extrémité'

Dans d'autres cas, les membres d'une paire de mots peuvent être distingués par un trait grammatical ou sémantico-grammatical.

Les deux mots sont donc homophones, mais ils ne sont pas homonymes. C'est le cas des paires suivantes, dont un membre désigne un animé et l'autre un inanimé:

cadre m `personne salariée' cadre m `bordure qui entoure un tableau etc.'
dame f `femme mariée' dame f `pièce dans un jeu d'échecs'
saint m `personne dont la vie est exemplaire' sein m `mamelle'
tante f `soeur de la mère ou du père' tente f `abri portatif'

Dans les homopaires suivantes, dont les deux membres désignent un inanimé, l'un est masculin et l'autre féminin:

boue f `terre détrempée d'eau' bout m `extrémité'
foret m `instrument pour percer' forêt f `grande étendue de terre plantée d'arbres'
pot m `récipient' peau f `membrane qui recouvre le corps'

Dans une troisième série, l'un des membres peut être utilisé avec un ou une, alors que l'autre requiert l'article partitif:

legs `don par testament' lait `liquide fourni par les vaches'
J'ai reçu un legs Je veux du lait

(Le permier type est appelé comptable, le deuxième non-comptable.)

Exercice: Trouver 10 homopaires (paires d'homophones ou d'homonymes en français). Essayez de découvrir pour chaque paire s'il s'agit de deux mots homophones ou de deux mots homonymes. Quels sont les critères que vous appliquez?

Début.


Une relation morpho-sémantique ou sémantique

Une partie importante du vocabulaire de tous les jours est consacrée à la désignation des personnes et à d'autres animés. Dans ce groupe, nous trouvons des relations complexes entre paires de termes pour les êtres mâles et féminins.

Examinons les paires suivantes:

mâle féminin
homme femme
garçon fille
cuisinier cuisinière
couturier couturière
ouvrier ouvrière
il elle
chien chienne
coq poule
bouc chèvre

Qu'est-ce qui est commun aux paires de la série, et qu'est-ce qui varie? N'oubliez pas de tenir compte du pluriel des mots donnés.

Exercice: Trouvez 4 paires de nom désignant des êtres vivants de deux sexes. Examinez la relation sémantique et la relation morphologique (s'il y a lieu) entre les membres de chaque paire.

Début.


À lire:

Beauchemin, N., Martel, P., Théoret, M. (1992) Dictionnaire de fréquence des mots du français parlé au Québec: fréquence, dispersion, usage, écart réduit. New York: P. Lang. (REF)

Brunet, É. (1981) Le vocabulaire français de 1789 à nos jours: d'après les données du Trésor de la langue française. Paris: Champion. (REF)

Chaurand, Jacques. (1977) Introduction à l'histoire du vocabulaire francais. Paris: Bordas. (RES)

Fortier, Gilles. (1993) Le vocabulaire des adolescents et des adolescentes du Québec. Montréal: Les éditions logiques. (REF)

Gougenheim, G. R. Michea, P. Rivenc, A. Sauvageot. (1967) L'élaboration du français fondamental (1er degré). Paris: Didier. (RES)

Imbs, Paul. (1971) Dictionnaire des fréquences, vocabulaire littéraire des XIXe et XXe siècles. Paris: Didier, Klincksieck, 1971. (REF)

Picoche, Jacqueline. (1977) Précis de lexicologie française. Paris: Nathan. (RES)

Surridge, M.E. (1994) Différenciation systématique des homophones nominaux non-homonymes en français, Cahiers de lexicologie 64:155-175.

Début.


Dernière modification: 28 décembre 1996. Veuillez signaler des problèmes d'ordre technique à Greg Lessard <lessardg@post.queensu.ca>