Typologie des onomatopées

Cette typologie est inspirée de Meinard, Maruszka Eve Marie. 2021. Le défi définitoire de l’interjection et de l’onomatopée : une étude contributive, axée sur l’anglais contemporain, ms. de thèse, Université de Lyon. Accès au texte complet

Introduction

Puisque le terme onomatopée peut être utilisé pour faire référence à des faits de langue très différents, précisons dès à présent que nous avons fait le choix terminologique d’utiliser ce terme pour désigner les items dont le but est clairement d’imiter un référent sonore, comme CLICK, BAM, ZING, BOING, The dog goes BOW-WOW (“Le chien fait OUAH OUAH”).

L’onomatopée ne constitue qu’une partie des faits de langue étudiés dans le cadre d’une recherche sur la motivation du signe. Inversement, la dichotomie naturel/conventionnel, appliquée aux signes linguistiques et plus largement à la communication, peut recouvrir des phénomènes qui n’ont rien à voir avec le phono-symbolisme, nous pensons par exemple à Wharton,^[1] qui présente l’interjection comme un signe procédural se situant près d’un pôle de signes appelé naturel et s’opposant à un pôle conventionnel.

Ce double dépassement mène Körtvélyessy^[2] à proposer deux acceptions pour le terme onomatopée : l’onomatopée primaire, qualifiée de proper sound imitation par l’auteur, où l’imitation motive le signifiant et définit le mot (par exemple, MEOW dans The cat goes MEOW!“Le chat fait MIAOU !”). Cela correspond à la définition restreinte de cette classe de mots. Si, en revanche, l’imitation dont participe le mot ne sert qu’à motiver le signifiant du signe (comme le verbe to meow “miauler”), alors il s’agit d’une onomatopée secondaire. Il y a donc deux paramètres pour intégrer dans la classe : la définition et la motivation. Nous ne travaillerons ici que sur ce que Körtvélyessy appelle des onomatopées primaires. Notre travail consistera à voir en quoi cela consiste, pour un mot, d’être défini comme une imitation. Nous utiliserons également les termes primaire/secondaire, mais pour une autre raison et en référence à une autre dichotomie.

La structure du signifiant onomatopéique a été amplement étudiée, notamment par Rhodes,^[3] qui propose un système de classifications binaires des formes motivées : vocal tract images et non-vocal tract images (imitations de productions vocales et imitations de bruits non issus des cordes vocales) ; visual et aural images (par exemple, to pop up correspond au sens visuel et to go pop au sens oral) ; wild et tame forms (les wild forms sont les imitations sans équivalent dans le lexique, les tame forms sont des onomatopées, et les semi-wild forms constituent les onomatopées apparaissant derrière des verbes introducteurs, qui peuvent être des protolexies). En se concentrant sur les signes regroupant les trois paramètres non-vocal tract images, aural images et semi-wild forms, Rhodes parvient à une description de l’iconicité de la structure syllabique des onomatopées.

Oswalt^[4] met en place une typologie des structures phonétiques de ce qu’il appelle animate et inanimate imitatives, à savoir, des onomatopées représentant des sons respectivement produits par des êtres animés et inanimés ; cette distinction rejoint celle de Rhodes (1994) et se révèle pertinente pour la description des onomatopées.^[5]

Les travaux de Körtvélyessy fournissent également une typologie des onomatopées anglaises et slovaques en fonction de la structure de leur signifiant, mais dans le but cette-fois-ci de juger du caractère idiosyncratique de la catégorie et de sa correspondance avec les autres items de la langue. D’un point de vue phonotactique, l’onomatopée ne constitue pas une catégorie de mots différente des autres ; du point de vue de la structure syllabique, de la fréquence des phonèmes ainsi que de leurs combinaisons, il n’y a pas de différence entre les onomatopées et les autres catégories de mots ; cependant, la structure syllabique et les phonèmes présents dans les onomatopées ont tendance à être répétés à une fréquence supérieure à celle observée chez les items non-onomatopéiques, pour l’anglais. Mais ce n’est donc avant tout qu’en raison de son statut sémiotique que l’onomatopée diffère des autres lexèmes.

Appellations et typologies d’onomatopées

Une difficulté concernant la description des onomatopées est la diversité des systèmes d’oppositions que l’on trouve dans la littérature : il y a souvent deux ou trois types d’onomatopées.

Galperin^[6] parle d’onomatopées directes et indirectes : la dichotomie est assez originale, puisque les directes correspondent peu ou prou à des allitérations (par exemple, utiliser de manière récurrente des lexèmes contenant le phonème /s/ dans une phrase pour reproduire le son d’un bruissement), alors que les indirectes constituent un ensemble de répétitions d’un item lexical non iconique ayant pour effet de recréer l’impression du référent désigné par l’item.

Pour Attridge,^[7] il y a les onomatopées lexicales et non-lexicales : cette dichotomie distingue les items en fonction de leur intégration dans le lexique.

Bredin^[8] les divise en trois types : direct, associative et exemplary. Les direct sont celles dont la fonction est d’imiter le son auxquelles elles réfèrent (ZOOM, BANG, HISS), les associative permettent d’imiter un aspect du référent de l’item : CUCKOO ne ressemble pas à un oiseau mais à un aspect de l’oiseau, son cri ; les exemplary mettent en lien le signifié avec les caractéristiques articulatoires du signifiant, et plus particulièrement, l’effort musculaire articulatoire effectué au moment de leur prononciation.^[9]

Carling et Johansson^[10] distinguent les items avec et sans étymologie. Les premiers (avec étymologie) ont une histoire qu’il est possible de retracer jusqu’à la superfamille de langues ; les seconds (sans étymologie) sont de trois sortes : direct emergence, comme pour PLOP, qui est une onomatopée récente datant du XIXe selon l’Oxford English Dictionary, structural émergence, qui désigne une forme motivée qui change de voyelle, et analogical emergence, où c’est une association avec un autre item iconique qui fait apparaître la forme (comme pour FLEET, FLICKER, FLIP).

Laing^[11] propose la dichotomie suivante : les formes conventionnalisées, avec une structure fixe, et les formes expressives, plus flexibles et qui illustrent le son.

Onomatopée, étiquetages

L’onomatopée a connu un parcours difficile en tant que catégorie métalinguistique. Elle est mentionnée par Quintilien (fin du Ier siècle) dans Institutio Oratoria^[12] non pas en tant qu’item lexical motivé, mais en tant que néologisme, ce qui correspond en fait à son étymologie (création de noms). La question de la motivation est mentionnée par Quintilien, mais en référence au Cratyle. C’est Bede (dit le Vénérable) qui pour la première fois emploie le terme d’onomatopée avec sa signification actuelle^[13] dans De schematibus et tropis datant du début du VIIIe siècle. Selon Moore, le dictionnaire bilingue anglais-latin d’Elyot datant de 1538 (The Dictionary of Sir Thomas Elyot Knight) semble être la première utilisation anglaise du terme onomatopoeia en tant que catégorie métalinguistique désignant des items lexicaux motivés apparentant à des classes de mots ouvertes.

Les dictionnaires actuels ont tendance à ne pas utiliser le terme onomatopée en tant qu’étiquetage métalinguistique et à préférer catégoriser des items comme CLAC (en français), comme des interjections (dans le Larousse), des items comme MIAOU comme des substantifs (toujours dans le Larousse), des items comme BOING comme des exclamations (dans l’Oxford English Dictionary) et à la qualifier leur étymologie d’imitative ou echoic. Moore l’explique par la méfiance que suscite le terme onomatopée dans les dictionnaires d’anglais.^[14]

Description à visée énonciative : exemples

Dans le cadre d’une description à visée énonciative des onomatopées, en nous appuyant sur des exemples en anglais, pour comprendre où se situent les premières difficultés dans l’extraction de leurs occurrences, observons quelques exemples.

EX1 : BOING BOING (un petit garçon qui produit des bruits de ressort)^[15] ATTENTE AJOUT IMAGE SI OBTENTION DROIT

EX2 : VHAUFF (un feu qui s’embrase)^[16] ATTENTE AJOUT IMAGE SI OBTENTION DROIT

EX3 : CLICK (le bruit métallique d’un verrou)^[17] ATTENTE AJOUT IMAGE SI OBTENTION DROIT

Il est intuitivement facile de dire que les exemples 1 à 3 sont des onomatopées, car dans tous les cas, une forme linguistique est utilisée dans le but d’imiter un événement sonore (bruit de ressort, embrasement, bruit métallique). Cependant, on peut déjà observer deux catégories bien différentes : en 1 et en 2, nous observons ce que nous appelons des onomatopées matricielles (OM), c’est-à-dire des mots dont la matrice lexicogénique est l’onomatopée. En effet, BOING a été créée 1950 dans un court métrage d’animation adapté d’une fiction de Dr. Seuss. Dans cette animation, le personnage principal ne parle pas mais émet des bruitages comme le fameux son métallique d’un ressort, représenté dans l’image 1 par la forme BOING. Cette forme est donc spécifiquement conçue pour l’imitation d’un référent sonore. Par la suite, BOING s’est lexicalisée pour devenir un substantif désignant a reverberating sound, selon l’Oxford English Dictionary. C’est pourquoi nous l’appelons onomatopée matricielle lexicalisée (OML). VHAUFF a également été créée dans le but de reproduire un référent sonore, dans la bande dessinée Dark Lord’s Conscience,^[18] mais contrairement à BOING, elle n’a pas été lexicalisée, nous l’appelons donc onomatopée matricielle non lexicalisée (OMNL).

En 3 cependant, CLICK n’est pas comparable aux exemples précédents : selon l’Etymological Dictionary of the English Language de Walter W. Skeat, CLICK proviendrait du verbe clakken en Moyen Anglais. Il est bien évidemment possible d’y voir un signe linguistique motivé, mais la différence avec 1 et 2 provient du fait que cet item n’est pas initialement créé dans le but d’imiter un son, mais pour désigner (par un verbe et un nom) la production d’un son. Ce n’est que dans un second temps qu’elle a été employée dans le but d’imiter un son à partir d’une forme déjà existante dans le lexique (nous affinerons plus bas la distinction désignation/imitation). Seule une recherche diachronique permet de faire la différence avec les exemples 1 et 2, car cela correspond à ce qu’Anscombre>ref>Anscombre, J. C. (1985), « Onomatopées, délocutivité et autres blablas », Revue romane, 20(2), p. 171.</ref> appelle l’hypothèse des cycles de fonctions lexème-onomatopée-lexème, où l’origine lexicale de l’expression de départ en arrive ainsi à être totalement opaque en synchronie, et l’on croit avoir affaire à une pure harmonie imitative. Nous appelons ce type d’items onomatopée primaire (OP, dans une acception quelque peu différente de celle de Körtvélyessy), et la matrice lexicogénique dont elle est issue semble être cette fois-ci la conversion : depuis une classe ouverte, nom ou verbe, jusqu’à la catégorie onomatopée, pourtant non répertoriée dans toutes les grammaires comme une catégorie grammaticale. Cette conversion semble, à première vue, consister en une mise en saillance du signifiant (au détriment du signifié) entre la classe ouverte de départ et la catégorie d’arrivée.

Pour l’instant, il semble bien que la mise en saillance du signifiant soit le point commun le plus immédiatement perceptible entre tous ces exemples : la forme phonologique du signe est interprétée comme une reproduction du référent sonore, qui se prétend fidèle dans la limite des contraintes du système phonologique. Cette mise en saillance du signifiant est-elle la caractéristique définitoire des onomatopées ? Cela ne semble pas être le cas, comme le montrent les exemples suivants :

EX4 : SOB (sanglot), CRY (pleur)^[19] ATTENTE AJOUT IMAGE SI OBTENTION DROIT

EX5 : WHINE et WHIMPER (gémissement, pleurnicherie), FRET (tracas), SIGH (soupir)^[20] ATTENTE AJOUT IMAGE SI OBTENTION DROIT

Dans l’exemple 4, toutes les formes sont placées dans un contexte clair : une bande dessinée contenant des images et des agrégats de lettres (formulons-le ainsi pour l’instant) situées à proximité de la source de l’événement sonore signalé par ces lettres. Il y a d’un côté des formes clairement identifiables comme onomatopées (SNIFF et H’K, cette dernière pouvant être influencée par le substantif Hiccup(“Hoquet”), mais comment catégoriser CRY et SOB ? Toutes ces formes servent à signaler la même chose, des sanglots ou le bruit produit par ces sanglots, et aucun élément ne permet de distinguer visuellement, syntaxiquement, sémiotiquement, SOB et CRY de H’K et SNIFF se situent tous hors d’un phylactère, mais tous sont reliés par un appendice, ce qui montre que les bruits proviennent bien des personnages. Les exemples WHINE, WHIMPER, FRET et SIGH en 5 sont similaires.

Si ce ne sont pas des onomatopées, alors il ne peut s’agir que de radicaux de verbes ou des substantifs avec détermination zéro (donc, procédant d’une opération de renvoi à la notion, selon les termes de la Théorie de Opérations Enonciatives). Cependant, cette interprétation pose de nombreux problèmes : que signifierait ce renvoi à la notion ? Pourquoi leur positionnement et leur graphisme est-il identique à celui des onomatopées classiques ? Nous ne voyons pas d’autre solution logique que de les interpréter comme des cas particuliers d’onomatopées. Leur point commun avec les onomatopées des exemples 1, 2 et 3 est leur rôle de signal d’un événement sonore. Leur différence semble se situer dans la mise en saillance du signifiant vue plus haut : SOB, CRY, FRET, etc. sont à la fois présentes pour imiter un référent sonore, mais ne mettent pas le signifiant plus en saillance que le signifié. Nous appelons cette dernière série des onomatopées secondaires (dans une acception totalement différente de celle de Körtvélyessy).

Il semble donc que la caractéristique de l’onomatopée ne soit pas tant la motivation du signe linguistique, mais plutôt cette façon spécifique de signaler un référent sonore (que le signifiant soit mis en saillance ou pas) et qu’il s’agit pour nous de décrire plus précisément.

Nous allons maintenant détailler notre démarche aboutissant à une description du rôle de l’onomatopée axée sur la distinction entre ce que nous appelons exposition et désignation.

Description à visée énonciative : idéalisation d’une situation de communication axée sur le point de vue du transcripteur

Nous observerons la transcription d’un discours oral en nous intéressant tout d’abord au filler (marqueur d’hésitation ou pause remplie, pour reprendre les termes de Duez,^[21] qui est le fait de langue que cette approche nous permet le plus aisément de décrire, avant d’appliquer le raisonnement à l’onomatopée. Nous montrerons que cette approche implique de distinguer deux actes bien spécifiques de la part du transcripteur : exposition et désignation.

Fillers

Soit une situation d’énonciation, que nous nommerons Sit₀ pour adopter la terminologie de la TOE, contenant trois instances énonciatives :

– Un locuteur (L1), locuteur-origine, énonçant un discours oral

– Un transcripteur (L2) : transcrivant à l’écrit le discours de L1

– Un lecteur (L3) : interlocuteur de L1, lisant le discours de L1 transcrit par L2.

L3 n’est pas présent, c’est une instance énonciative abstraite, mais les locuteurs ont conscience du fait que, dans le futur, ce texte lui sera accessible.

Appelons énoncé idéal la partie du discours produite consciemment et volontairement par le locuteur (L1) et appelons parasites vocaux et parasites sonores, les éléments audibles que le transcripteur (L2) peut ajouter à cet énoncé idéal. Pour décrire le processus d’inscription d’un parasite au milieu d’un discours, observons cette situation du point de vue de L2, le transcripteur. Son environnement sonore pourrait être divisé en deux parties :

1. Les événements sonores environnants (du vent par les fenêtres, une sonnerie de téléphone, des bruits de pas dans une pièce adjacente, etc.).

2. Les productions phonatoires de L1 comprenant :

2.1. : L’énoncé idéal de L1.

2.2. : Les productions phonatoires de L1 n’appartenant pas à son énoncé idéal (cela peut-être une production phonatoire avec ou sans voix : expirations, toux, rires, réactions vocales incontrôlées, et même des répétitions de segments), fréquemment éliminés des transcriptions.^[22]

Observons les exemples construits suivants 6 et 7 :

EX6 : When I see other people’s upbringings I think, hmm, mine was rather unconventional.

EX7 : When I see other people’s upbringings I think [HESITATES] mine was rather unconventional. (« Quand je vois comment les autres ont été élevés, je me dis que mon éducation a été… HEU… assez peu conventionnelle »)

Nous avons mis en gras les éléments appartenant à l’énoncé idéal de L1 et en italique les éléments constituant des parasites vocaux. Tous ces éléments (en plus des bruits environnants) constituent l’environnement sonore de L2, à partir duquel il extrait le discours de L1.

En 6, la production vocale de L1, ([ə(ː)] ou [ə(ː)m]) est inscrite dans la forme HMM, ce qui a pour conséquence de rendre accessible au lecteur le bruit produit par l’hésitation de L1 : on sait que son hésitation consiste en une production vocale qui n’est pas corrélée à la formulation d’un énoncé. Mais le transcripteur aurait très bien pu choisir d’autres formes comme ER, UM, ou UH, ou même des graphèmes de son choix, comme EEEHMMM : il ne s’agit donc pas de l’emploi de HMM de la part de L1,^[23] mais du choix du transcripteur. Ainsi, si quelqu’un emploie l’occurrence d’un filler, c’est bien le transcripteur, et non pas L1.

L2 est donc la source énonciative de HMM,^[24] ce qui signifie que L2 choisit d’intervenir (et non plus seulement de transcrire l’énoncé idéal) et c’est pourquoi nous parlerons d’une source énonciative intervenante.^[25]

En 7, on observe deux différences majeures : tout d’abord, l’inscription [HESITATES] rend inaccessible à L3 la production vocale de L1. Le lecteur L3 ne peut pas savoir ce qui, chez L1, a signalé à L2 une hésitation : cela peut être une pause, un bégaiement, un petit rire gêné, un mouvement d’épaule, ou autre. Ensuite, l’intervention du transcripteur devient perceptible : la 3e personne (hesitates) indique une opération de rupture entre l’énonciateur (L2, le transcripteur) et le sujet de la prédication (L1). Les marqueurs de repérages annoncent la présence du transcripteur, et c’est pourquoi nous parlerons d’une source énonciative détectable.

En 6, L2 se rend au contraire indétectable : il serait tout à fait possible pour L1 de lire à voix haute la transcription de son propre discours, de lire HMM et de passer pour l’émetteur de ce parasite vocal, alors même que la source énonciative du texte lu est en réalité le transcripteur. Le fait que L1 puisse relire la transcription de son parasite vocal tout en passant pour la source énonciative de ce fillermontre le caractère fusionné des deux sources énonciatives L1 et L2 dont procède le filler transcrit.

Le caractère indétectable de la source énonciative intervenante provient du fait que les éléments servant à transcrire le parasite vocal sont présentés par L2 à partir du point de vue énonciatif du locuteur L1 : nous appellerons cela la perspective énonciative fusionnée. Ainsi, en Sit₀, qui contient un environnement sonore dont le discours de L1 fait partie, nous pouvons décrire L2 comme le témoin d’une scène, nous l’appelons transcripteur-témoin. Appelons exposition l’attitude énonciative qui consiste à ne pas fournir de marqueur de repérage et ainsi fusionner les sources énonciatives de L1 et L2. Ce que montre cette comparaison entre 6 et 7, c’est que le transcripteur-témoin peut choisir deux attitudes :

– Soit le transcripteur intervient et se rend visible en désignant le parasite vocal (en 7) avec une forme qui contient des marqueurs de repérages énonciatifs. Dans ce cas, il y a clairement deux discours et deux sources énonciatives détectables : le discours de L1 (rapporté par la transcription) et le discours de L2 (le transcripteur).

– Soit le transcripteur intervient mais reste effacé, en exposant le parasite vocal, grâce à une forme qui semble appartenir au discours de L1. Dans ce cas, en 6, il n’y a qu’une seule source énonciative clairement détectable, celle de L1.

Onomatopées

Appliquons maintenant ce type de paires minimales aux onomatopées. Observons des captures d’écran de films d’animation incluant des sur-titrages pour sourds et malentendants.^[26] En 8, on peut voir la transcription du bruit produit par une vitre brisée dans une scène fictive à l’aide de la forme suivante [glass shatters] (« La vitre vole en éclats »). Ici, l’intervention du transcripteur est détectable, le bruit est désigné depuis un point de vue qui est annoncé grâce l’opération de rupture entre l’énonciateur et le sujet de la prédication (glass shatters, 3e personne du singulier). De plus, ce segment de proposition est mis entre crochets, ce qui signale le fait que le bruit produit par une vitre brisée est lui-même signalé par le transcripteur. Une intervention détectable du transcripteur est donc un méta-signal : un signal qui se signale.

EX8 : [glass shatters] (bruit d’une vitre qui se brise) ATTENTE AJOUT IMAGE SI OBTENTION DROIT

Dans le même film d’animation, quelques secondes plus tard, une autre scène contient un bruit indiqué par des sur-titrages. Nous la présentons en deux images (rassemblées et notées EX9), qui correspondent aux étapes de la chute et du rebond d’un objet métallique sur le sol. Le bruit produit par cet événement est signalé par la forme CLANG CLANG CLANG.

EX9 : CLANG CLANG CLANG (bruit des rebonds d’un objet métallique sur le sol) ATTENTE AJOUT IMAGE SI OBTENTION DROIT

Ici, le transcripteur ne se signale plus : pas de crochets, pas de proposition, pas de marqueur de repérage (pas d’opération de rupture). Le transcripteur choisit une onomatopée primaire (CLANG vient du verbe latin clangere, signifiant « résonner ») répétée plusieurs fois. On peut voir dans cette paire minimale la même différence qu’entre les exemples 8 et 9.

Observons maintenant l’exemple 10 contenant l’onomatopée CLICK, qui correspond au bruit produit par l’extinction d’un réveil dans une bande dessinée.

EX10 : CLICK (bruit produit par l’extinction d’un réveil)^[27] ATTENTE AJOUT IMAGE SI OBTENTION DROIT

Mis à part les caractéristiques visuelles des glyphes composant l’onomatopée et sa position dans la vignette, il n’y a pas de différence avec 9. En effet, les instances énonciatives de transcripteur en 9 et de narrateur en 10 adoptent toutes deux la position de témoins face à une scène fictive et ces témoins donnent des informations sur l’environnement sonore de cette scène sans présenter leur propre position face au dictum (sans marqueurs de repérage, ce sont donc des sources intervenantes non détectables).

Au même titre que le transcripteur-témoin effectuant des sur-titrages pour sourds et malentendants (comme en 9), le narrateur d’une bande dessinée peut être considéré comme le témoin d’une scène (fictive ou réelle, peu importe pour notre axe de réflexion), qui va retranscrire des éléments d’un environnement sonore en masquant sa présence et en utilisant la matière linguistique (graphèmes, onomatopées primaires) comme vectrice de cette transmission. Ainsi, ces signes fournissent une information sur le moyen d’accès à l’information du transcripteur-témoin (il était bien là, il a bien assisté à la scène), ce qui en fait des marqueurs d’évidentialité. En cela, l’intervention du transcripteur-témoin avec des onomatopées se distingue nettement des didascalies, où les marqueurs de repérages permettent d’identifier son positionnement par rapport aux faits narrés.

L’onomatopée, du point de vue du lecteur, est donc ce qu’il reste de l’exposition d’un événement sonore grâce à une forme linguistique par une source énonciative indétectable.

Nous proposons donc la définition préliminaire suivante pour l’onomatopée :

ONOMATOPEE : TRACE DE L’EXPOSITION D’UN EVENEMENT SONORE PAR UNE SOURCE ENONCIATIVE INTERVENANTE INDETECTABLE DANS UNE MATIERE LINGUISTIQUE.

Spécificité de l’onomatopée par rapport au filler

Attardons-nous quelques instants sur la perspective énonciative adoptée par le narrateur. Pour le narrateur d’une bande dessinée, l’environnement sonore dont il est un témoin fictif n’est pas principalement une production langagière, mais un bruit non-humain. Nous ne pouvons donc pas qualifier le caractère indétectable du narrateur comme nous l’avons fait avec le filler, où L2 fait fusionner sa perspective énonciative avec celle de L1. En effet, avec l’onomatopée, il n’y a pas de L1. Alors, d’où vient le caractère indétectable du narrateur employant une onomatopée ? Avec quelle perspective énonciative fusionne-t-il ?

Les polices de caractère et les couleurs choisies pour les onomatopées, qui diffèrent de celles des dialogues des personnages dans les phylactères, montrent que l’onomatopée permet de représenter visuellement un événement sonore : McCloud décrit les onomatopées comme des effets sonores qui permettent d’entendre avec les yeux.^[28] Le son est donc un des faits narrés, au même titre que les autres dessins. La présence du narrateur (extradiégétique, omniscient dans les exemples précédents) n’est pas plus détectable dans l’onomatopée que dans les dessins ou que dans les dialogues de ses personnages, à la différence d’un commentaire comme [glass shatters] ou d’une didascalie. Ainsi, la perspective adoptée par le narrateur est fusionnée avec les autres faits narrés.

La double iconicité de l’onomatopée : au niveau du mot et au niveau de la perspective énonciative

À la différence des didascalies, les dessins et onomatopées partagent le point commun suivant : il s’agit de signes iconiques, et en tant qu’icônes, ils possèdent la caractéristique sémiotique d’être des manifestations de ce que Peirce appelle la priméité, à savoir que le representamen (la forme matérielle du signe) est la reproduction d’une caractéristique perceptible du référent (pour les dessins, une caractéristique visible, pour les onomatopées, une caractéristique audible). L’onomatopée, comme le dessin, à la différence du récit narré par la parole, prétendent reproduire le fait narré, et ce, à deux niveaux :

1. Au niveau des caractéristiques de l’item : que nous appelons iconicité au niveau du mot, les propriétés phonétiques de CLICK en tant que nom, verbe ou onomatopée, sont iconiques, il s’agit de la motivation du signe.

2. Au niveau de la perspective énonciative adoptée : que CLICK soit une imitation ratée ou réussie d’un son sec et aigu, lorsque cet item est utilisé comme onomatopée, le référent est exposé.

L’onomatopée matricielle et primaire est donc doublement iconique : une première fois au niveau du mot et une seconde fois au niveau de la perspective énonciative. C’est ce deuxième niveau d’iconicité (de priméité) que nous appelons l’exposition : il s’agit d’un niveau énonciatif, indépendant des caractéristiques de l’item. Ajoutons que l’exposition est possible même quand le référent n’est pas un bruit : il s’agit d’un cas-limite. Le fait narré est exposé par un concept, et non pas par une matière linguistique qui pourrait prétendre imiter le moindre bruit, comme les exemples suivants.

EX11 : TRAIL, TRAIL, went her long dress over the sopping grass, […] trailing noiselessly over the lawn… (Littéralement, cette phrase signifie : « Traîne, traîne, faisait sa longue robe sur l’herbe mouillée […], qui traînait sans un bruit sur la pelouse… ». On remarque que l’onomatopée secondaire TRAIL est beaucoup plus naturelle en anglais qu’en français.)

En 11, TRAIL TRAIL n’est explicitement pas un son, comme l’indique l’adverbe noiselessly. L’onomatopée secondaire redoublée TRAIL TRAIL consiste en l’exposition d’un mouvement par le moyen d’un signe linguistique présenté comme s’il s’agissait d’une séquence visuelle. La source énonciative qu’est le narrateur est tout aussi indétectable que dans le cas des autres onomatopées et fillers, car il n’y a pas de marqueur de repérage.

Exposition et discours rapporté

À partir de ce que nous avons vu, nous pouvons observer les points suivants :

L’onomatopée a un statut particulier, elle se situe sur un plan de l’énoncé différent des autres faits de langue : l’onomatopée a la particularité de ne jamais apparaître ailleurs que sur ce plan du discours, sous cette forme spéciale de discours rapporté. Ce dernier provient d’une source qui est la plupart du temps un événement sonore et la plupart du temps non-parlante. En effet, ce discours rapportén’a au départ jamais été prononcé par une véritable instance énonciative : ce sont les bruits émis par des animaux et produits par des objets, que le narrateur/transcripteur-témoin rapporte, pas les énoncés des locuteurs.

Ce que nous appelons exposition correspond également au Discours Rapporté au Style Direct (DRD) et aux autonymes et procède d’une attitude du locuteur qui en fait des marqueurs privilégiés d’évidentialité.^[29] La désignation correspond à tout le reste. D’ailleurs, les onomatopées et interjections apparaissent typiquement derrière certains verbes introducteurs : certains (comme Kleiber, 2006^[30] ) proposent même de définir l’onomatopée et l’interjection en fonction du verbe qui les introduit : l’interjection est COD d’un verbe de parole ou du verbe faire, quand l’onomatopée ne peut pas être COD d’un verbe de parole (la pierre a fait PLOUF, *la pierre a dit PLOUF). C’est donc à partir du point de vue du transcripteur, se rapportant à un référent sonore ou discursif, que l’onomatopée devient observable. Cela ne signifie pas que l’onomatopée est toujours une transcription ; cela signifie simplement que c’est à partir de ce poste d’observation qu’on peut la voir. Ce statut de discours rapporté de source non-parlante permet par conséquent des effets de style, comme faire passer de véritables énoncés pour de simples bruits dépourvus d’intérêt, comme le permettent des formes comme BLAH BLAH BLAH, YADA YADA, que nous appelons onomatopées de production phonatoire.

Ce statut s’applique à de nombreux types d’items : des items créés par le narrateur (les onomatopées matricielles), des items déjà prévus en langue à cet effet (les onomatopées primaires), et même, n’importe quel item de classe ouverte (les onomatopées secondaires). Les référents sont également très divers : ce n’est pas forcément un bruit, qui est rapporté, cela peut être un mouvement (TRAIL TRAIL, went her dress noiselessly), la soudaineté d’un événement (and BANG, you’re in love « Et BANG ! t’es amoureux ») ou même, un degré élevé d’exactitude (we’re SLAP BANG on this trajectory « Nous sommes pile-poil sur cette trajectoire » (BANG est ici intraduisible avec une onomatopée française).

Nous proposons donc une description énonciative de l’onomatopée, ce qui peut sembler risqué, puisqu’elle met au second plan le caractère motivé du signe onomatopéique. En effet, même s’il y a un nombre restreint d’items souvent employés comme onomatopées, et souvent eux-mêmes considérés comme motivés, on peut trouver des exemples très divers (comme SOB, CRY, FRET), non répertoriés dans les dictionnaires comme exclamations, interjections ou onomatopées, dans les contextes tout aussi divers (pas forcément la bande dessinée), même s’ils ne sont pas a priori considérés comme des signes linguistiques motivés. L’onomatopée, ce n’est donc pas d’abord une catégorie de mots qui ont la particularité d’être motivés, mais un emploi, qui procède de l’utilisation d’une matière linguistique pour reproduire une matière sonore par une instance énonciative qui se présente comme témoin d’une scène, mais qui se rend indétectable pour l’interlocuteur ou le lecteur. La différence entre désignation et exposition tient avant tout en une position affichée de l’énonciateur (du narrateur, du transcripteur) par rapport aux événements (sonores ou non) dont il est témoin et qu’il raconte.

Reformatage de l’acte d’exposition

La notion de reformatage

Mais cet acte d’exposition pourrait très bien être effectué avec une imitation pure du référent sonore, sans utiliser de forme onomatopéique, un peu comme les boîtes à rythme humaines. Comparons l’onomatopée et le filler aux boîtes à rythme humaines. Le locuteur fabriquant son néologisme fabrique la transcription d’un événement sonore, sa seule contrainte étant d’utiliser des graphèmes et des phonèmes (et pas des notes de musique, ou autre). La forme qui en résulte n’est qu’un support pour l’imitation d’un référent sonore. Ce support lui-même n’est pas une imitation, en cela nous rejoignons presque Attridge^[31] : Finally, the tendency in reading nonlexical onomatopoeia is to produce in the voice an imitation of the sound, rather than a literal reading […] of what is on the page. (« Finalement, en lisant une onomatopée non-lexicale, la tendance est de produire une imitation du son avec la voix plutôt qu’une lecture littérale de ce qui est écrit sur la page. »)

Nous rejoignons presque Attridge, car il décrit le passage de l’écrit à l’oral, et effectivement, à l’oral, l’imitation du référent sonore ne correspond pas à la lecture littérale de l’onomatopée non-lexicale, ce qui illustre bien la différence entre l’onomatopée en corpus (la forme linguistique) et l’onomatopée en parole. Cependant, même à l’oral, le locuteur aura tendance à s’appuyer sur des phonèmes de sa langue pour effectuer son imitation : il y a bien un reformatage phonémique, qui correspond à une volonté de conventionnaliser l’imitation du son. Ce n’est pas l’onomatopée elle-même qui imite ou reproduit le son, mais bien le sujet parlant. Ainsi, la forme onomatopéique sert à donner une structure phonémique et syllabique à un acte d’imitation (donc, d’exposition) effectué par le locuteur en parole. Dans un second temps seulement, cette imitation s’inscrit dans une forme linguistique. Dans un troisième temps, l’onomatopée (en corpus) est interprétée comme la reproduction linéaire d’un bruit, du point de vue de l’interlocuteur, en raison de la mise en saillance du signifiant dont elle procède. Par conséquent, si au moment de la prononciation d’une onomatopée, les fluctuations prosodiques et vocales sont libres, l’utilisation de phonèmes permet de structurer l’imitation du référent sonore, ce qui différencie la prononciation d’une onomatopée à l’oral des bruitages que produisent les boîtes à rythme humaines. La différence avec les bruitages produits par les boîtes à rythme humaines est que l’onomatopée consiste en une modification de l’imitation du bruit extralinguistique, afin que le résultat se rapproche de la convention et soit identifié comme du langage humain. Cet aspect est, selon nous, l’élément le plus central de ces faits de langue, il explique pourquoi leur définition nécessite la mise en regard de trois lieux : langue, parole et corpus. Pour l’onomatopée matricielle non-lexicale, nous l’appelons reformatage phonémique. Pour l’onomatopée matricielle lexicale, primaire et secondaire, il s’agit d’un reformatage lexical.

La notion de trace

En créant une onomatopée matricielle, en utilisant une onomatopée primaire ou un filler, le transcripteur-témoin prend l’initiative en parolede reformater son propre acte d’exposition d’un événement sonore ou d’un parasite vocal à l’aide d’unités linguistiques disponibles en langue : soit des graphèmes, des phonèmes qu’il agence lui-même pour reformater le bruit, dans le cas de la création lexicale (VHAUFF, EEERHM), soit des lexèmes qu’il réutilise dans ce but, dans le cas de l’onomatopée primaire, secondaire et du filler (CLICK, SOB, HUM). Ce qu’il reste de cette initiative, ce que l’on extrait du corpus, c’est donc la trace du reformatage. Ainsi, avec les onomatopées, fillers (et interjections, même si ce n’est pas l’objet du présent article) l’harmonie parfaite langue-parole est brisée, ce qui aboutit à l’apparition d’une trace en corpus. En parole, on observe un acte de reformatage ; en langue les unités linguistiques sont employées comme des outils pour effectuer le reformatage ; en corpus, on observe le résultat du reformatage. Ainsi, ce qui était un signe linguistique (CLICK) est détourné pour devenir un outil de reformatage. L’outil choisi pour le reformatage peut être particulièrement efficace et adapté en raison de la motivation du signe linguistique détourné (comme avec CLICK) ou peut au contraire sembler inadapté (comme avec FRET, dans l’exemple 5). Cela provient selon nous de la double iconicité dont procède l’onomatopée.

La voix et le signe linguistique : un rapport inversé

Le processus dans lequel s’inscrivent nos faits de langue peuvent se découper en quatre parties :

1. L’acte métalinguistique en lui-même : le reformatage d’une production vocale.

2. Un moyen : le détournement d’un élément de langue pour en faire un outil (un phonème ou un item lexical).

3. Un but : conventionnaliser une production vocale.

4. Un résultat : une trace en corpus.

Dans cette section, nous allons travailler sur les raisons du but, qui est de conventionnaliser une production vocale. Pour la majorité des signes linguistiques, la voix humaine est un instrument, un outil, dont le sujet parlant se sert pour prononcer les phonèmes. Cet outil, nous l’appelons voix 1, c’est la voix du locuteur. Les signes dont nous parlons ici ont un rapport inversé à la voix humaine : c’est le signe qui devient l’outil. En effet, le signe linguistique n’est plus qu’un réceptacle, il sert à reformater une production vocale (pour l’interjection et le filler) ou l’exposition d’un référent sonore (pour l’onomatopée). Les signes linguistiques sont donc détournés de leur fonction habituelle pour permettre à la voix de s’y inscrire. Nous allons ranger les trois classes par les types de voix qu’ils servent à reformater.

La Règle du Canal de Communication (RCC)

L’onomatopée, en langue, est un outil permettant de donner une structure phonémique et syllabique à l’exposition d’un bruit. Mais pourquoi faut-il forcément donner une forme linguistique à une production vocale ? Pourquoi ne peut-on pas imiter les référents sonores à la manière des boîtes à rythme humaines ? Nous ne voyons pas d’autre solution que de postuler l’existence d’une règle de communication, qui impose aux locuteurs d’utiliser leurs vocalisations exclusivement pour produire du langage. En d’autres termes, si une vocalisation est émise dans un autre but (par exemple, exposer un référent sonore), alors il faut au moins donner l’apparence du langage à cette vocalisation (et donc, donner une structure phonémique et syllabique à l’acte d’exposition). Nous nommons cette contrainte la Règle du Canal de Communication (RCC).

Types de Voix

L’onomatopée : Voix 2

Appelons voix 1, la voix permettant aux locuteurs de prononcer des phonèmes. Cette voix est un outil permettant de communiquer dans les langues vocales. L’onomatopée, en langue, est un signe qui n’a pas vocation à être prononcé (comme le montre Attridge), mais qui a, au contraire, vocation à reformater l’exposition d’un référent sonore, c’est-à-dire à donner une forme linguistique à une imitation effectuée par le locuteur. Cette voix n’est pas présentée comme provenant du locuteur, mais comme une imitation d’un bruit du monde, donc, provenant de l’extérieur du locuteur. L’onomatopée est en langue un outil permettant de reformater une voix provenant d’une autre source sonore : nous l’appelons la voix 2, la voix-extérieure-au-locuteur.

Le locuteur ne fait que jouer un rôle, il utilise son corps, ses cordes vocales pour fabriquer un son provenant d’une autre source sonore. Le locuteur, pendant le moment de l’imitation, se dissimule, il efface son statut de source énonciative, d’où son caractère indétectable. Comme nous l’avons dit plus haut, lorsqu’un sujet parlant imite directement un référent sonore, le résultat ressemble aux productions des boîtes à rythme humaines. Cette comparaison met en lumière le fait que les onomatopées structurent et contraignent l’imitation du référent sonore, afin de la rendre plus acceptable sur un plan linguistique. Cela permet au locuteur d’affirmer son statut de sujet parlant (ce que les boîtes à rythme humaines ne font pas). On voit apparaître un paradoxe spécifique à l’onomatopée : le locuteur affirme son statut de sujet parlant tout en utilisant une voix 2, extérieure au locuteur. Il y a ainsi une inadéquation entre la source d’où provient la voix et l’objet que la voix produit : la voix est présentée comme provenant de l’extérieur, mais elle réalise phonétiquement, lexicalement, des objets de langage (pour obéir à la RCC).

Les onomatopées en langue sont ainsi de simples outils, des réceptacles, elles procèdent d’un rapport inversé entre la voix et le signe : elles permettent à une source vocale présentée comme étrangère (la voix 2) de s’inscrire dans un lieu (l’onomatopée) qui a bien un statut linguistique. Même la voix reformatée à l’aide de l’onomatopée secondaire est une voix 2, c’est d’ailleurs en cela qu’il s’agit bien d’une onomatopée : le locuteur est toujours dissimulé et sa perspective énonciative est fusionnée avec les faits narrés. La différence avec l’onomatopée primaire et matricielle, c’est la présence perceptible du signifié : avec l’onomatopée secondaire, le signe entier sert à reformater cette voix 2.

La littérature propose quelques études sur les caractéristiques prosodiques spécifiques à l’onomatopée, comme celle de Laing et collaborateurs,^[32] qui montre que les onomatopées sont plus saillantes que les items dits conventionnels en matière de hauteur de ton, de tessiture, de longueur du mot, de longueur des pauses. Peut-être est-ce dû au fait que l’onomatopée n’est en réalité pas prononcée, mais qu’au contraire elle structure une imitation.

Le filler : Voix 1+

Le filler, en langue, est un signe permettant au locuteur de poursuivre une production vocale alors même qu’aucune production verbale n’a lieu. Le filler diffère radicalement de l’interjection en ce sens que la production vocale qu’il permet de reformater est toujours directement liée à un acte d’énonciation : le filler est parfois appelé une pause remplie (Duez, 2001), il permet au locuteur d’émettre une production vocale en vue d’énoncer un discours, alors même que sur le moment, il n’a pas les mots. Quand la source énonciative est L1, il est d’ailleurs difficile d’évaluer de manière tranchée si le filler n’est pas simplement le relâchement d’un point d’articulation. Cette production vocale-là est inhérente à l’acte d’énonciation, c’est de la voix 1, permettant de prononcer les phonèmes. Mais la production vocale démarre trop tôt, quand l’outil qui sert à prononcer les signes est déclenché, mais qu’il n’y a pas les signes en face, l’outil fonctionne à vide, et le locuteur peut choisir d’utiliser un signe de substitution pour permettre à l’outil de fonctionner sur quelque chose, afin d’obéir à la RCC. Le signe de substitution, le réceptacle, qu’on appelle le filler, devient donc un outil servant à gérer le surplus de voix 1 : il peut être un simple phonème (/ʌ/), un lexème (well) ou une relation prédicative (y’know).

La voix que le filler en langue sert à reformater, c’est de la voix-locuteur-en-surplus, nous l’appelons voix 1+. Au sein de l’acte d’énonciation, se produit une dissymétrie entre l’acte phonatoire et l’énoncé : ce dernier est absent face à la voix qui était pourtant émise pour le prononcer. Le filler est donc la manifestation d’une absence. Cette dissymétrie est corrigée par le reformatage de l’acte phonatoire à l’aide d’un filler. Pour cette raison, le filler n’est pas du tout une sous-catégorie de l’interjection. Tout au contraire, les fillers que l’on trouve en corpus sont les simples corollaires de cette dissymétrie.

Interjection : la Voix 0

Pour terminer cette typologie des voix, évoquons brièvement celle que l’interjection permet de reformater. Nous l’appelons voix 0, et la rapprochons de ce qui est appelé prosodie affective ou émotionnelle dans la littérature consacrée à l’étude des productions vocales qui ne servent pas à la production du langage. Une abondante littérature y est consacrée, comme en témoignent les méta-études de Kotz et collaborateurs,^[33] et plus récemment, l’étude de Grisendi et collaborateurs.^[34] Comme le montre la revue de Jürgens et collaborateurs,^[35]on sait qu’il y a chez les primates au moins deux voies cérébrales pour le contrôle des mouvements de la cavité buccale et des vocalisations : la voie limbique (qui est peut-être le chemin de la voix 0), contrôlée par le cortex cingulaire antérieur et passant par la substance grise périaqueducale, qui contrôle des vocalisations appelées émotionnelles (comme les cris). L’autre voie est cortico-motrice (il s’agit de ce que nous appelons la voix 1), elle implique le cortex-moteur, c’est un circuit beaucoup plus complexe (qui passe par le putamen, le pallidum, le thalamus, puis le cervelet, la formation réticulée puis les neurones moteurs du tronc cérébral). Ces deux voies existent également chez l’Homme, c’est peut-être pourquoi les lésions du cortex moteur générant des aphasies n’affectent pas la capacité à produire et reconnaître les vocalisations contrôlées par la voie limbique. Ce qui est intéressant, c’est que les interjections sont, elles aussi, reconnues chez les patients souffrant d’aphasie (comme le montre Goodglass,^[36] avec l’exemple de OUCH).

Propositions de définitions

Nous allons ici récapituler quelques propriétés importantes de chaque sous-catégorie d’onomatopée vue dans cet article, avant de passer à nos propositions de définition. Syntaxiquement, l’onomatopée peut être isolée (comme c’est souvent le cas dans les bandes dessinées, l’item étant seul parmi les éléments graphiques dans la vignette), elle peut avoir l’apparence d’un COD lorsqu’elle est en position de discours rapporté au style direct, elle peut être positionnée à côté d’un nom tel un adjectif ou telle la première partie d’un nom composé (Vid made giant SNIP-SNIP movements. « Vid fit de gigantesques mouvements en COUPE-COUPE. »), elle peut être positionnée à côté d’un circonstant ou d’un autre élément à modifier, tel un adverbe (SLAP BANG in the middle ; he fell BANG against the wall. « Et BANG ! il heurta le mur. »).

Morphologiquement, le redoublement syllabique, l’alternance vocalique, certains types de troncatures, mais aussi graphiquement, la présence de tirets, de lettres capitales, de guillemets, sont des signaux indiquant que l’élément est, précisément, à interpréter comme une onomatopée : il s’agit de ce qu’Anscombre^[37] appelle des règles de formation des harmonies imitatives, qui « renforcent le caractère expressif de la forme ». Quand le verbe click est utilisé comme l’onomatopée CLICK, l’item effectue ce que nous appelons la fonction syntaxique et sémiotique de l’onomatopée : sémiotiquement, le signifiant est interprété comme une imitation du référent. Cette fonction sémiotique, qui est une réinterprétation du signe, qui impose à l’interlocuteur (ou au lecteur-narrataire) de mettre de côté le signifié et d’interpréter le signifiant comme une recréation du référent (une exposition du référent), va de pair avec une fonction syntaxique de l’onomatopée, qui est non pas un isolement formel (car certaines onomatopées se situent formellement dans la proposition), mais un isolement que l’on pourrait appeler fonctionnel : l’élément ne fait pas partie de la construction d’une relation prédicative mettant en relation différents actants d’un procès. En effet, même si formellement, l’élément peut être intégré (He fell bang against the wall, we’re right SLAP BANG in the middle), malgré tout, la fonction sémiotique d’exposition du référent a pour conséquence ce que nous appelons une équivalence référentielle : le référent est à la fois désigné ET exposé.

Onomatopées matricielles

L’onomatopée matricielle est issue la matrice lexicogénique onomatopée (comme BOING, ZAP, ZONK). Parmi ces onomatopées matricielles, nous distinguons deux sous-catégories :

– Celles qui sont ponctuellement utilisées par un locuteur ou un auteur pour imiter un son (comme VHAUFF), mais qui n’ont pas rencontré de succès particulier et n’ont jamais été reprises par d’autres auteurs : elles font donc partie de l’idiolecte d’un auteur et sont par définition impossibles à répertorier. Attridge^[38] les appelle non-lexical onomatopoeia. Nous les appelons onomatopées matricielles non-lexicales.

– Celles qui ont été créées par un auteur et ont fini par entrer dans le lexique (comme BOING et ZAP). La conversion de ces onomatopées en éléments de classes ouvertes est parfois elle-même entrée dans le lexique (BOING a donné le substantif et le verbe boing, idem pour ZAP). Attridge les appelle lexical onomatopoeias, mais il ne les distingue pas de ce que nous appelons onomatopées primaires. Nous les appelons onomatopées matricielles lexicales.

Onomatopées primaires

Les onomatopées que nous appelons primaires se différencient de celles que nous appelons matricielles lexicales, et en cela, nous rejoignons les travaux d’Anscombre (1985), Carling et Johansson (2014), Laing (2014), Carling (2017), Körtvélyessy (2020). Il s’agit de la plupart des onomatopées que l’on peut trouver dans n’importe quel corpus (bandes dessinées ou ailleurs) : ce sont des items utilisés dans le but d’imiter un son à l’aide des caractéristiques du signifiant, mais qui ont la particularité de provenir d’éléments appartenant à des classes ouvertes. Ces items sont donc des noms, verbes ou autres, recatégorisés en onomatopées et n’apparaissant que dans certains contextes syntaxiques (par exemple, en Discours Rapporté au Style Direct (DRD) exerçant l’apparente fonction de COD d’un verbe introducteur ou derrière un quotatif (comme dans The cork went: POP! « Le bouchon fit PAF ! »). Körtvélyessy les appelle pseudo-onomatopoeia.

Ce en quoi consiste la conversion de ces classes ouvertes en onomatopées primaires semble être une mise en saillance du signifiant : le locuteur réinterprète le signifiant d’un item de classe ouverte comme s’il s’agissait d’une reproduction linéaire directe du référent, et donc, comme s’il s’agissait d’une onomatopée matricielle. Malgré la mise en saillance du signifiant, le rôle du signifié est présent avec les onomatopées primaires :

Rôle du signifié dans le choix de la conversion d’une classe ouverte en onomatopée primaire : pour inscrire l’imitation d’un son produit par des cordes vocales du lion, il est adapté de choisir de convertir en onomatopée un verbe désignant le fait d’émettre un cri grave et prolongé (to roar « Rugir » > ROAR). De la même manière, si l’on veut inscrire l’imitation d’un son produit par un objet métallique, il est adapté de choisir de convertir en onomatopée un verbe désignant le fait de provoquer un son léger et aigu (to click > CLICK).

Rôle du signifiant : comme les onomatopées dont nous parlons ici sont primaires (et non pas matricielles), la question du caractère motivé du signifiant se pose d’abord au niveau de la classe ouverte, et non pas au niveau de son emploi comme item exposé : il est adapté de construire un signifiant contenant beaucoup de voyelles pour désigner le fait de se lamenter (ROAR vient du verbe rārian en Vieil Anglais, signifiant « émettre un cri prolongé, se lamenter, beugler »). Il est plus adapté de construire un signifiant contenant une faible proportion de voyelles pour désigner un son inharmonique (CLICK est utilisé en Anglais Moderne Naissant, il est daté à 1580 et désigne l’action de provoquer un son léger et aigu).

Cela nous mène à un paramètre spécifique à l’onomatopée primaire : son inadéquation entre la sélection du signe en langue et son emploi en parole.

Pour l’onomatopée primaire, la forme lexicale qui reformate l’exposition du référent est choisie en raison de son signifié (pour créer la forme CLICK, le lexème click est choisi en raison de son signifié). Il nous faut donc distinguer deux étapes bien différentes (que nous nommons l’inadéquation entre la sélection du signe en langue et l’emploi du signe en parole) :

L’étape n°1 : le locuteur fait le choix de sélectionner en langue tel signe (click, par exemple, et pas tilt ou kilt), en raison de son signifié, et accessoirement, de son signifiant.

L’étape n°2 : Le lecteur réinterprète la forme (CLICK) comme si son signifiant était une reproduction du référent. C’est à cette étape que le signifiant est mis en saillance.

On ne reconnaît pas immédiatement leur conversion depuis une classe ouverte jusqu’à la classe onomatopée, on peut les confondre avec des onomatopées matricielles, d’où la difficulté de leur description si l’on ne pose pas une fonction (syntaxique, sémiotique, énonciative) spécifique à l’onomatopée. Une fois que cette fonction est posée, c’est alors l’existence de l’onomatopée secondaire qui est rendue possible.

Onomatopées secondaires

Dans un contexte propice à l’émergence d’onomatopées comme la bande dessinée, on observe des éléments qui s’éloignent graduellement de l’onomatopée clairement identifiable, comme nous le résumons dans la chaîne suivante, en partant à gauche de l’onomatopée matricielle non-lexicale, jusqu’à l’onomatopée secondaire, à droite :

VHAUFF >>> BOING >>> KLIK >>> CLICK >>> PAT >>> SOB

Nous l’avons vu, les onomatopées primaires sont converties à partir d’items lexicaux, mais il n’est pas du tout évident pour le locuteur que la conversion se fasse dans ce sens. L’onomatopée secondaire a la particularité d’être clairement convertie depuis le lexique. L’onomatopée secondaire est un item lexical qui exerce la fonction sémiotique, énonciative et syntaxique de l’onomatopée (le référent semble exposé et non pas désigné, la source énonciative qui l’émet est indétectable), mais cet item lexical ne subit pas d’effacement sémantique (l’item est clairement utilisé pour son signifié) et n’impose donc pas à l’interlocuteur une réinterprétation du signifiant comme recréation linéaire du référent exposé.

Comme l’onomatopée primaire, l’onomatopée secondaire peut être redupliquée, surtout dans des contextes autres que la bande dessinée (Vid made giant SNIP-SNIP movements). L’onomatopée secondaire n’imite pas forcément un bruit (TRAIL TRAIL, went her dress noiselessly). Les onomatopées représentant des cris d’animaux dans le jeu Pokémon sont également des exemples d’onomatopées secondaires : le cri de ces animaux de fiction est constitué de leur nom (le personnage de Pikachu crie : « PIKA PIKA ! »).

Conclusion

Nous avons vu que le rôle de l’onomatopée était de permettre au locuteur d’effectuer un acte de reformatage, à l’aide d’outils disponibles en langue, d’une production vocale qui n’était pas effectuée pour produire des énoncés, mais pour exposer des référents sonores. L’attitude du locuteur est d’exposer un référent sonore (au lieu de le désigner) et cet acte d’exposition est par la suite reformaté dans une forme linguistique, que nous appelons « onomatopée ». Nous pouvons ainsi distinguer deux actes successifs, l’exposition du référent sonore, puis le reformatage de l’acte d’exposition dans une forme linguistique.

Le but de ce reformatage est de rendre la vocalisation plus conventionnelle en donnant une forme phonémique et syllabique à l’imitation d’un événement sonore. Nous avons proposé d’interpréter ce but comme la conséquence d’une règle que nous avons nommée Règle du Canal de Communication, selon laquelle toute production vocale doit obligatoirement aboutir à l’énonciation d’un signe linguistique. Cela expliquerait pourquoi il existe, en langue, de tels outils. Nos faits de langue procèdent donc d’un rapport inversé entre la voix et le signe : le signe devient un outil au service de la voix.

Comme il s’agit d’un reformatage, le statut de ces faits de langue est également totalement différent en parole et en corpus, et selon que la source énonciative est L1 ou L2. L’acte de reformatage vocal est un procès qui se déroule dans le temps et dont l’enjeu est de transformer une entité (une production vocale non langagière) en son entité opposée (une production langagière). Les trois classes (interjection, onomatopée et fillers) se distinguent en fonction du type de voix sur lequel s’applique l’acte de transformation. Ce n’est donc pas en tant que signes qu’ils diffèrent les uns des autres, mais au niveau du type de voix qu’ils permettent de reformater. On observe donc une confusion induite par les étiquetages métalinguistiques, qui établissent une différence dans la classe de signes, alors que la différence se situe dans l’élément qu’ils permettent de reformater (voix 0, voix 1+, voix 2). Pourrait-on aller plus loin et dire qu’une onomatopée pourrait, sans problème, être utilisée pour reformater une voix 0 ? Cela ne semble fonctionner que dans de rares cas : l’onomatopée GRRRR, qui imite un rugissement, est parfois employée pour manifester une excitation ; dans BAM! Take that!, l’onomatopée BAM est employée pour manifester une hostilité vis-à-vis d’un interlocuteur ; le OH évaluatif de Richet^[39] est une interjection employée pour reformater une voix 1+.

Enfin, nous avons proposé de distinguer trois lieux de réflexion pour l’onomatopée :

– La question du caractère motivé de l’outil (le mot en langue est un signe linguistique motivé).

– Ce que fait le sujet parlant vis-à-vis du référent : il l’expose en l’imitant vocalement (au lieu de le désigner, il s’agit du premier acte effectué par le locuteur).

– La question du reformatage en parole, en direct, du geste imitatif pour lui donner une forme linguistique : le sujet parlant inscrit l’exposition du référent sonore dans une forme linguistique (il s’agit du deuxième acte effectué par le locuteur).

Notes

Wharton T. (2003a), “Interjections, language, and the `showing/saying’ continuum”, Pragmatics & Cognition, vol. 11 (1), p. 39-91 ; Wharton T. (2003b), “Interjections, language and the ‘showing’/ ‘saying’ continuum”, Pré-publication.
Körtvélyessy, L. (2020). “Onomatopoeia–A Unique Species?”, Studia Linguistica, 74(2), 506-551.
Rhodes, R. (1994), “Aural images”, Sound symbolism, p.276-292.
Oswalt, R. L. (1994), “Inanimate imitatives in English”, Sound symbolism, p. 293-306.
Körtvélyessy, L. (2020), op. cit.
Galperin, I. R. (1981), Zvukooboznacheniya v hudozhestvennoy proze [Sound-imitation of literary prose], Russkaya rech [Russian speech], 1, p. 73-81.
Attridge, D. (1984), “Language as imitation: Jakobson, Joyce, and the art of onomatopoeia”, MLN, 99(5), p. 1116-1140.
Bredin, H. (1996), “Onomatopoeia as a Figure as a Linguistic Principle”, New Literary History, vol. 27 (3) p. 555-569.
Bredin, H. (1996), op. cit, p. 557-563.
Carling, G., Johansson, N. (2014), “Motivated language change: processes involved in the growth and conventionalization of onomatopoeia and sound symbolism”, Acta linguistica hafniensia, 46(2), p. 207-211.
Laing, C. E. (2014), “A phonological analysis of onomatopoeia in early word production”, First Language, 34(5), p. 387-405.
Bredin, H. (1996), op. cit, p. 556
Moore, C. (2014), “An ideological history of the English term onomatopoeia”, Studies in the History of the English Language VI, De Gruyter Mouton, p. 309.
Moore, C. (2014), op. cit., p. 316.
Gerald McBoing Boing, By Dr. Seuss, Illustrated by Mel Crawford, Published by Random House Books for Young Readers, 2017, ISBN 9781524716356
Classic StarWars, Devilworlds, par Alan Moore, Steve Moore, Steve Parkhouse. Source web : https://www.starwars-holocron.net/comics/classic-star-wars-devilworlds-1, Page consultée le 04/10/2019
Source web : https://education.yourdictionary.com/for-teachers/poetry-lesson-plans-onomatopoeia.html
Nous ne pouvons dire si elle a été créée par le lettreur John Aldrich ou par le scénariste Alan Moore, car lettreur et scénariste peuvent tous deux peuvent prendre en charge les onomatopées.
Sob Story, de FunnyBrain, sur DeviantArt photo, Source web : https://www.deviantart.com/funnybrain/art/Sob-Story-871819094
Comics Kingdom | Zits by Jerry Scott & Jim Borgman, Source web : https://comicskingdom.com/zits/2016-03-31
Duez, D. (2001), « Caractéristiques acoustiques et phonétiques des pauses remplies dans la conversation en français », Travaux interdisciplinaires du Laboratoire parole et langage d’Aix-en-Provence (TIPA), 20, p. 31-48.
Jackson, C. (2016), “Data Collection in Conversation Analysis”, The SAGE Handbook of Qualitative Data Collection, p.280.
Bien évidemment, il est possible pour L1 de feindre l’hésitation ou de mettre en scène son propre embarras (par ironie ou auto-dérision), mais ces considérations ne nous occupent pas ici.
Il y a d’ailleurs des différences entre HMM et ER, le premier montre une hésitation tranquille, le second montre une hésitation plus embarrassée. Au niveau d’analyse où nous sommes, cette différence n’a pas de conséquence.
Le fait de nettoyer tous les marqueurs d’hésitation serait aussi une intervention : il semble que toute transcription confrontée à autre chose que l’énoncé idéal procède d’un acte d’analyse et d’un choix.
Capture d’écran extraite de la série d’animation Teen Titans Go ! (S1: E2 Driver’s Ed/ Dog Hand).
Idem note 19
McCloud, S. (2006), Making Comics: Storytelling Secrets of Comics, Manga and Graphic Novels, New York, Harper, p. 146.
MEINARD, Maruszka, E.-M.(2021), Le défi définitoire de l’interjection et de l’onomatopée: une étude contributive, axée sur l’anglais contemporain, Thèse de doctorat, Université de Lyon ⟨NNT : 2021LYSE2056⟩. ⟨tel-03608244⟩)
Kleiber, G. (2006), « Sémiotique de l’interjection », Langages, vol. 40 (161), p. 10-23.
Attridge, D. (2009), “Joyce’s Noises”, Oral Tradition, 24/2, p. 471-484.
Laing, C., Vihman, M., Keren-Portnoy, T. (2017b), “How salient are onomatopoeia in the early input? A prosodic analysis of infant-directed speech”, Journal of Child Language, 44(05), p. 1117-1139. DOI: https://doi.org/10.1017/S0305000916000428 Published online by Cambridge University Press, 27 September 2016.
Kotz, S. A., Meyer, M., Paulmann, S. (2006), “Lateralization of emotional prosody in the brain: an overview and synopsis on the impact of study design”, Progress in brain research, 156, p. 285-294 ; Kotz, S. A., Paulmann, S. (2011), “Emotion, language, and the brain”, Language and Linguistics Compass, 5(3), p. 108-125. DOI: 10.1016/S0079-6123(06)56015-7. PMID: 17015086.
Grisendi, T., Reynaud, O., Clarke, S., Da Costa, S. (2019), “Processing pathways for emotional vocalizations”, Brain Structure and Function, 224(7), p. 2487-2504.
Jürgens, U. (2009), “The neural control of vocalization in mammals: a review”, Journal of Voice, 23(1), p. 1-10.
Goodglass, H. (1993), Understanding Aphasia, Cermark L. (ed.), New York, Academic Press.
Anscombre, J. C. (1985), op. cit, p. 170.
Attridge, D. (1988), Peculiar Language: Literature as Difference from the Renaissance to James Joyce, Ithaca, Cornell University Press, p. 136, 148.
Richet, B. (2011), « Des oh et débats – Mise en spectacle de la quantification/qualification à l’oral », ⟨halshs-00661985⟩, https://halshs.archives-ouvertes.fr/halshs-00661985