[Niveau supérieur | QLink ]
Pour saisir l'importance de la lexicologie, il vaut la peine de réfléchir sur nos capacités de manipulation lexicale. Chaque locuteur d'une langue possède des milliers de mots. Certains de ces mots sont utilisés tous les jours, mais d'autres n'apparaissent pas dans la bouche ou sous le stylo qu'une ou deux fois par année. Malgré cela, nous arrivons à trouver les mots qu'il nous faut dans un instant, sans même y faire attention. Il y a donc une question de stockage et d'accès qu'il faut examiner.
Mais avant même d'analyser les mots de la langue, il faut commencer par préciser ce qu'on étudie. Qu'est-ce que c'est qu'un mot?
Exercice: Combien de formes et d'occurrences y a-t-il dans
les
suites:
|
En (2), la situation se complique
davantage. Certains
locuteurs
diraient qu'il y a 7 mots dans la suite, tandis que d'autres y
verraient
5. Les premiers comptent les occurrences, tandis que les autres
mettent
ensemble un et une, d'une part, et petit
et
petite d'autre part. On voit qu'il faut faire une
deuxième
distinction:
on peut analyser certaines formes comme des manifestations d'un
même
lexème. Ainsi, il existe un lexème
PETIT, une classe
abstraite, qui possède quatre formes possibles à
l'écrit (
petit,
petits, petite, petites) et deux formes à l'oral
([p
ti],
[p
tit]), et chacune de ces formes peut avoir une ou
plusieurs
occurrences dans un texte.
Notons que la répartition des formes en lexèmes n'est pas toujours évidente. Par exemple, s'il est facile de voir que deux formes comme table et tables représentent le même lexème, et qu'il en va de même pour les adjectifs, l'identité des articles soulève des problèmes. Est-ce qu'on considère comme relevant d'un même lexème un et une? Si oui, faut-il les mettre ensemble avec des, qui serait leur forme plurielle? Faut-il combiner dans un seul lexème les différentes formes de l'adjectif possessif mon, ton, son, ma, ta, sa, mes, tes, ses? Et à un niveau plus général, faudrait-il mettre ensemble toutes les formes du déterminant dans un seul lexème?
Il n'y a pas une seule réponse correcte à cette question. Tout ce qu'on peut faire est de préciser clairement ses définitions, et de les respecter par la suite. Mais revenons à nos exemples.
En (3), on voit la présence de deux formes distinctes d'un même verbe. Il y a donc 8 occurrences dans l'exemple, et 8 formes, mais il y a 7 lexèmes (si on met ensemble lis et lisais et si on sépare je et tu).
L'exemple (4) ajoute une autre complication. Faut-il traiter comme une seule forme lirai et as lu? Pour justifier un tel choix, on pourrait arguer que as lu n'est qu'une autre forme du verbe. Pour justifier le contraire, on pourrait signaler qu'il est possible de diviser as lu (ex. tu n'as pas lu le livre).
En (5), il s'ajoute encore une autre complication. On trouve deux occurrences de le, mais s'agit-il de la même forme? La plupart des linguistes diraient que non, puisque la première occurrence représente l'article le, tandis que la deuxième occurrence représente le pronom le.
Par contre, en (6) on voit qu'une telle division n'est pas toujours simple. On y trouve 3 occurrences de bois. Dans un cas, il semble clair qu'on a un lexème distinct: la troisième occurrence est un verbe, donc une forme du lexème BOIRE. Par contre, dans les deux premières occurrences, on a des noms. Le problème vient du fait que le sens des deux noms n'est pas identique. Dans le premier, il s'agit de `forêt' et dans le deuxième, de `matière'. Certains linguistes y verraient deux lexèmes, d'autres un seul.
Pour conclure, on voit que le terme mot est dangereusement flou. Dans la suite, nous parlerons d'occurrences de formes et de lexèmes, tout en retenant le fait que les distinctions ne sont pas toujours faciles à faire.
En même temps, tous les locuteurs qui parlent une même langue partagent une masse d'unités lexicales. Aucun locuteur ne possède toutes, mais ensemble, leurs vocabulaires combinés définissent une unité supérieure qui existe au niveau de la communauté: nous l'appelons le lexique.
Exercice:
|
À côté de son vocabulaire actif, chaque locuteur possède aussi un vocabulaire qu'il ou elle comprend, sans l'utiliser pour la production. On parle alors de vocabulaire passif. Les limites du vocabulaire passif sont aussi difficiles à mesurer, pour plusieurs raisons. D'abord, le fait de posséder des mécanismes de créativité lexicale donne à chaque locuteur la possibilité de comprendre des mots nouveaux.
En principe, vous seriez capable de comprendre n'importe quel mot nouveau en non- ou en re-. Plus sérieusement, la notion même de comprendre est assez floue. Voyons les exemples suivants:
| Exercice: Trouvez trois mots à l'écrit ou à l'oral, que vous comprenez partiellement. Utilisez chaque mot dans trois phrases. Ensuite, cherchez la définition du mot dans un bon dictionnaire. Comparez la définition avec votre compréhension du mot telle que représentée dans les phrases. |
Au niveau oral, une conversation pourrait former un corpus, un ensemble de conversations dans les mêmes circonstances formeraient un autre, et ainsi de suite.
Il existe pour le français plusieurs corpus importants. Au niveau écrit, le Dictionnaire des fréquences du Trésor de la langue française fournit des données sur un corpus important de textes français du XIXième et du XXième siècles. Au total, ce corpus comprend plus de 70,000,000 d'occurrences (32,663,549 occurrences pour le XIXième et 37,653,685 occurrences pour le XXième siècle).
Pour le français parlé, le Français fondamental, basé sur 275 conversations, comprend 312,135 occurrences divisées entre 7995 formes.
Le nombre d'occurrences d'une forme donnée dans un corpus s'appelle sa fréquence absolue. Pour obtenir la fréquence absolue d'un lexème, on additionne la fréquence de ses différentes formes. Lorsqu'on analyse un corpus selon les fréquences absolues, on constate un certain nombre de relations.
Premièrement, les mots les plus fréquents sont tirés des mots outils à fonction grammaticale (les déterminants, les prépositions, les conjonctions, les auxiliaires). Les noms, les verbes et les adjectifs occupent les fréquences plus basses. En fait, un très petit nombre de mots grammaticaux représentent une très grande proportion d'un texte.
Deuxièmement, on remarque que la longueur des mots a tendance à diminuer au fur et à mesure que la fréquence monte. Les mots les plus fréquents ont tendance à être très courts. Pensez à des formes comme le, et, à, de. Cela représente une tendance à l'économie.
Troisièmement, on remarque que les formes irrégulières se regroupent dans les hautes fréquences. Ainsi, dans les verbes français, les conjugaisons irrégulières se trouvent parmi les verbes usuels comme être, avoir, faire, aller, pouvoir, vouloir, etc.. Encore une fois, l'explication est simple: parmi les formes irrégulières, qui par définition sont plus difficiles à retenir que les formes régulières, seules les formes fréquentes ont tendance à rester en mémoire et à être renforcées par un usage constant.
| Exercice: Quels sont les 5 mots les plus fréquents dans le Trésor de la langue française? Dans un petit corpus de quelques pages, vérifier si les mêmes mots se présentent dans les plus fréquents. |
Tout cela se reflète dans la vie de tous les jours. Il existe des mots qu'on utilise assez peu souvent, qui dépendent d'une situation appropriée pour qu'on les utilise. Pensez à la dernière fois que vous avez utilisé les formes grille-pain, tracteur, plage. Afin de mesurer l'importance relative de ces formes, on a tendance à regarder au-delà des corpus et à utiliser d'autres outils, comme des tests par association. Par exemple, on donne un domaine (la cuisine, par exemple) à un groupe de locuteurs, et on leur demande d'écrire les 10 ou les 20 premiers mots qui leur viennent à l'esprit. (Voir Gougenheim 1967, Fortier 1993 pour des exemples.)
Les résultats d'un tel test nous permettent de mesurer ce qu'on appelle la disponibilité des unités lexicales, ou en d'autres termes, leur capacité à être rappelées par les locuteurs. En même temps, un test comme cela nous indique les micro-systèmes lexicaux, les unités qui ont tendance à se manifester ensemble. Dans le domaine de la cuisine, les micro-systèmes comprennent entre autres choses fourchette, couteau et cuiller, table et chaise, et tasse et soucoupe.
| Expérience: Choisissez un domaine et tester la disponibilité des mots du domaine. Êtes-vous capable de prédire les résultats sur la base de votre intuition linguistique? |
Dans d'autres cas, une idée innovatrice ou un objet nouveau est emprunté avec le nom qui le désigne.
De là les mots `français' suivants:
Ces mots d'origine étrangère s'appellent des emprunts (ou mots d'emprunt).
| Exercice: Trouvez d'autres exemples de mots d'emprunt en français. Est-ce que le français possède déjà un mot pour l'objet ou l'idée représenté? Proposez une raison pour l'emprunt. |
Dans plusieurs régions de la francophonie, on s'inquiète au sujet des emprunts à l'anglais. On peut lire dans les journaux des réactions très fortes contre ce `danger'. Mais pour bien évaluer l'effet de l'anglais sur le français, il nous faut des mesures quantitatives. Quel serait le pourcentage des emprunts? Est-ce que ce pourcentage varie selon la partie du discours (les noms versus les verbes), selon la communauté (la France versus le Canada), la modalité (l'oral versus l'écrit), ou le domaine (les sports versus les finances)? On n'examine de telles questions de façon rationnelle que depuis peu de temps.
|
Exercice 1: Prenez une page d'un journal francophone et
calculez le
pourcentage des emprunts à l'anglais, ainsi que la partie
du
discours de
chaque emprunt. Utilisez comme critère le fait que la
forme
n'existe pas
dans un dictionnaire du français, mais qu'elle existe dans
un dictionnaire
anglais.
Exercice 2: Quelles pourraient être les objections à l'emprunt? |
| chanter | chant |
| chanteur, chanteuse | |
| diphtongue | diphtonguer |
| diphtongaison | |
| diplomate | diplomatie |
| diplomatique | |
| diplomatiquement | |
| frais/fraîche | fraîcheur |
| fraîchement | |
| rafraîchir | |
| rafraîchissant | |
| rafraîchissement | |
| mérite | mériter |
| méritoir | |
| méritocracie | |
| merde | merdeux |
| emmerder | |
| emmerdé |
| Exercice: Trouvez deux `familles de mots'. Expliquez les relations entre les mots individuels. Attention! Quelquefois, les mots se ressemblent sans avoir (du moins en français) une relation de parente. Par exemple, diplôme, diplômer ressemblent à diplomate, diplomatique etc., mais la relation entre les deux groupes est seulement étymologique. |
Un homonyme est un mot qui est identique à un autre quant à sa structure phonologique, quant à ses fonctions dans le discours, et quant aux traits majeurs affectant son insertion dans la phrase.
Les paires suivantes sont constituées de deux homonymes:
| coup m `choc physique' | cou m `partie du corps' |
| faim f `besoin de manger' | fin f `bout, extrémité' |
Dans d'autres cas, les membres d'une paire de mots peuvent être distingués par un trait grammatical ou sémantico-grammatical.
Les deux mots sont donc homophones, mais ils ne sont pas homonymes. C'est le cas des paires suivantes, dont un membre désigne un animé et l'autre un inanimé:
| cadre m `personne salariée' | cadre m `bordure qui entoure un tableau etc.' |
| dame f `femme mariée' | dame f `pièce dans un jeu d'échecs' |
| saint m `personne dont la vie est exemplaire' | sein m `mamelle' |
| tante f `soeur de la mère ou du père' | tente f `abri portatif' |
Dans les homopaires suivantes, dont les deux membres désignent un inanimé, l'un est masculin et l'autre féminin:
| boue f `terre détrempée d'eau' | bout m `extrémité' |
| foret m `instrument pour percer' | forêt f `grande étendue de terre plantée d'arbres' |
| pot m `récipient' | peau f `membrane qui recouvre le corps' |
Dans une troisième série, l'un des membres peut être utilisé avec un ou une, alors que l'autre requiert l'article partitif:
| legs `don par testament' | lait `liquide fourni par les vaches' |
| J'ai reçu un legs | Je veux du lait |
(Le permier type est appelé comptable, le deuxième non-comptable.)
| Exercice: Trouver 10 homopaires (paires d'homophones ou d'homonymes en français). Essayez de découvrir pour chaque paire s'il s'agit de deux mots homophones ou de deux mots homonymes. Quels sont les critères que vous appliquez? |
Examinons les paires suivantes:
| mâle | féminin |
| homme | femme |
| garçon | fille |
| cuisinier | cuisinière |
| couturier | couturière |
| ouvrier | ouvrière |
| il | elle |
| chien | chienne |
| coq | poule |
| bouc | chèvre |
Qu'est-ce qui est commun aux paires de la série, et qu'est-ce qui varie? N'oubliez pas de tenir compte du pluriel des mots donnés.
| Exercice: Trouvez 4 paires de nom désignant des êtres vivants de deux sexes. Examinez la relation sémantique et la relation morphologique (s'il y a lieu) entre les membres de chaque paire. |
Brunet, É. (1981) Le vocabulaire français de 1789 à nos jours: d'après les données du Trésor de la langue française. Paris: Champion. (REF)
Chaurand, Jacques. (1977) Introduction à l'histoire du vocabulaire francais. Paris: Bordas. (RES)
Fortier, Gilles. (1993) Le vocabulaire des adolescents et des adolescentes du Québec. Montréal: Les éditions logiques. (REF)
Gougenheim, G. R. Michea, P. Rivenc, A. Sauvageot. (1967) L'élaboration du français fondamental (1er degré). Paris: Didier. (RES)
Imbs, Paul. (1971) Dictionnaire des fréquences, vocabulaire littéraire des XIXe et XXe siècles. Paris: Didier, Klincksieck, 1971. (REF)
Picoche, Jacqueline. (1977) Précis de lexicologie française. Paris: Nathan. (RES)
Surridge, M.E. (1994) Différenciation systématique des homophones nominaux non-homonymes en français, Cahiers de lexicologie 64:155-175.
Dernière modification: 28 décembre 1996. Veuillez signaler des problèmes d'ordre technique à Greg Lessard <lessardg@post.queensu.ca>