Print Friendly, PDF & Email

Philippe MARTIN

Un texte écrit n’existe que s’il est lu

 

Philippe Martin
Université de Toronto – Université Paris-Diderot
philippe.martin@linguist.univ-paris-diderot.fr

 

 

 

Ah bon?

Ce titre évoque une vérité que des siècles d’apprentissage de la lecture nous ont fait peut-être oublier, mais qui s’avère être une évidence: tout comme une partition musicale qui demande à être interprétée pour exister (ne fût-ce que dans la tête d’un musicien qui lirait silencieusement cette partition), le texte écrit ne peut faire sens, et donc exister dans sa fonction, que s’il est lu, ne fût-ce qu’en lecture silencieuse. Sinon, il n’est qu’un assemblage de caractères graphiques sans signification.

Or, tout comme il n’y a pas deux interprétations musicales identiques, il n’y a pas deux lectures identiques d’un texte, que ce soit à voix haute, à voix basse ou «dans sa tête». En lecture silencieuse. Cette dernière, appelée sous-vocalisation, est impossible à éviter, du moins pour l’immense majorité des lecteurs. Les très rares exceptions à la sous-vocalisation procèdent par lecture iconique, faisant directement sens des suites de caractères graphiques que sont les caractères formant les mots, à la manière d’un lecteur d’un texte en mandarin qui n’aurait jamais appris la prononciation de chaque idéogramme. D’autre part, il ne s’agira pas ici du concept saussurien de valeur, liant la signification des mots au contexte, à la situation ou à l’expérience du lecteur, mais du mécanisme de lecture lui-même.

Les groupes accentuels

Selon une définition linguistique classique, le mot est le plus petit élément pouvant être prononcé isolément avec un contenu sémantique ou pragmatique. Si cette description convient plus ou moins bien aux mots dits du contenu, tels que verbes, adjectifs, adverbes et noms, c’est-à-dire les mots de classe ouverte, une première difficulté apparait pour les mots grammaticaux, de classe fermée. Quel peut être en effet le contenu sémantique ou pragmatique d’une préposition telle que dans ou d’une conjonction comme et ou donc isolées de tout contexte?

Mais il y a plus problématique encore. Certes un mot du contenu peut être le plus petit élément qu’on puisse prononcer menant à une signification, mais nous ne parlons pas et nous ne lisons pas mot à mot, mais par groupes de mots. Cette définition du mot ne rend pas compte de l’utilisation réelle qui en est faite par le locuteur et le lecteur. En fait, lorsque nous apprenons à parler puis à lire, nous procédons non pas par mots mais par syllabes, et au fur et à mesure de nos progrès, nous utilisons des groupes de mots. Ces groupes ont une caractéristique particulière, ils contiennent un et une seule syllabe accentuée (hors accent d’insistance) et sont dès lors appelés groupes accentuels.

Pour des langues dites à accent lexical, comme l’anglais ou l’italien, le groupe accentuel contient un et un seul mot du contenu, puisque chacun d’eux est accentué par définition. Pour des langues dépourvues d’accent lexical, comme le français ou le coréen, c’est la durée d’énonciation ou de lecture qui détermine le nombre de mots rassemblés dans chaque groupe accentuel, que ce soient des mots du contenu ou des mots grammaticaux. La seule contrainte phonologique poste sur la position de la syllabe accentuée du groupe accentuel qui doit être finale, et peut donc frapper aussi bien un mot grammatical qu’un verbe, adverbe, adjectif ou nom.

En plus de cette contrainte phonologique, une contrainte rythmique limite la durée maximale des groupes accentuels, à quelque 1250-1350 ms, ce qui correspond à un maximum de 10 à 11 syllabes. De même, la durée minimale d’un groupe accentuel, en réalité l’espacement minimal pour que deux syllabes accentuées successives soient perçues comme telles, est d’environ 250 ms.

Ce qui est remarquable pour le français est que la contrainte rythmique entraine une composition différente des groupes accentuels selon la vitesse d’élocution ou de lecture. Une vitesse lente réduit le nombre de syllabes, et donc de mots, rassemblés dans un groupe accentuel. Une vitesse rapide permet l’inverse, obtenir des groupes accentuels contenant jusqu’à 10 à 11 syllabes, et donc potentiellement plus d’un mot du contenu, contrairement aux langues avec accent lexical.

Structure prosodique

Le phrasé, c’est-à-dire la segmentation du flot de parole en groupes accentuels, ne résulte pas simplement en une succession inorganisée d’unités prosodiques. Ces unités sont regroupées dynamiquement au cours du déroulement de la phrase selon les indications données, en français, par les mouvements mélodiques portés par les syllabes, en fait les voyelles, accentuées. Ces indications prennent la forme de variations mélodiques, montantes, descendantes, rapides, lentes, etc. En classant ces mouvements mélodiques (par une approximation basée sur le seuil acoustique de glissando) selon qu’ils sont perçus par l’auditeur comme variation ou comme ton statique, on détermine une grammaire de dépendance entre contours qui détermine in fine la structure prosodique de la phrase.

Cette structure, établie à partir de regroupements hiérarchiques des groupes accentuels, rend compte de la façon de l’auditeur traite l’information linguistique contenue dans chacun des groupes accentuels. Ce processus, qu’il convient d’envisager dans son aspect dynamique et temporel, est en fait essentiel en ce que la mémoire de l’auditeur dans la parole continue est limitée à quelque 2 à 3 secondes. Si le découpage du flot de parole et la structuration des groupes accentuels n’avait pas lieu, il serait seulement possible de comprendre des phrases très courtes, de 2 à 3 secondes au plus, suivies d’un silence pour permettre à l’auditeur d’avoir suffisamment de temps pour accéder au sens. C’est d’ailleurs ce qui explique en partie les conclusions parfois surprenantes de phonologie prosodique expérimentale portant sur des phrases de ce type, courtes et isolées. Ces expérimentations ne rendent compte que du traitement cognitif de l’intonation de la phrase dans des cas très particuliers.

La lecture silencieuse

La sous-vocalisation, inévitable pour des textes orthographiés, mais pas pour des textes iconiques (comme les émojis) entraine l’émergence d’une voix «dans notre tête», voix qui lirait avec toutes les caractéristiques de la lecture à voix haute, avec en particulier l’accentuation et l’intonation, la segmentation en groupes accentuels et leurs regroupements en structure prosodique, sans qu’il ne se trouve dans le texte des indications explicites de cette structuration, en dehors de rares signes de ponctuation.

Or, la lecture silencieuse obéit aux mêmes contraintes et règles que la lecture à haute voix et que la parole en général, mais est aussi contrainte par la vitesse des déplacements de focalisation oculaires. Ces déplacements, qui se produisent par saccades balaient le texte dans un empan d’environ 10 à 15 caractères avant et 20 à 25 caractères après le mot objet de la focalisation. Ces saccades de durent que 70 à 80 ms environ, alors que le passage avec sous-vocalisation d’un groupe accentuel au suivant requiert au moins 250 ms. La vitesse de lecture rapide se trouve donc bridée par la durée minimale de lecture silencieuse d’un groupe accentuel. La seule façon de lire plus vite est d’éviter la segmentation en groupes accentuels, par exemple en ne considérant que des mots clés, ce que proposent du reste certains logiciels de lecture rapide. Les liens syntaxiques et sémantiques entre ces mots isolés du contexte ne sont pas pris en compte dans la lecture, dont le texte se réduit à une (longue) suite de mots sans relation syntaxique explicite les uns avec les autres.

Icônes orthographiques, textos et émojis

Au cours de la lecture d’un texter apparaissent parfois des mots ou des groupes de mots qué, normalement, on ne prononcera pas silencieusement mais qu’on prononcerait à voix haute. C’est le cas par exemple du mot «STOP» d’un panneau routier, de dates très fréquentes et bien connues comme «1515» ou «1789». C’est aussi le cas des abréviations orthographiques, comme Mr., Dr., abréviations qui ne sont pas épelées en lecture silencieuse alors qu’elles sont développées en lecture à voix haute somme «monsieur» ou «docteur». Même orthographiés, ces groupes fonctionnent, pour les lecteurs comme des idéogrammes, non prononcés mais signifiants. On a alors, partiellement, une situation similaire à celle d’un lecteur de mandarin qui connaitrait la signification de chaque caractère tout en ignorant la prononciation.

L’utilisation et la généralisation des émojis dans les textos des smartphones procèdent du même processus. Ces symboles sont directement décodés par le lecteur sans passer par une phase de sous-vocalisation et ne peuvent du reste pas être oralisés à haute voix.

L’écriture inclusive

Les textes écrits, surtout journalistiques, présentent de plus en plus souvent des réalisations d’écriture inclusive, visant à compenser les préférences grammaticales et lexicales éventuelles aux formes masculines. Les traits d’écriture inclusive se manifestent essentiellement selon trois modes: la proximité syntaxique, qui, en français, peut aller à l’encontre de la règle voulant que «le masculin l’emporte» (ex. des étudiants et des étudiantes étrangères vs. des étudiants et des étudiantes étrangers); l’utilisation du point médian permettant plus ou moins efficacement de syncrétiser en une seul forme orthographique des déclinaisons masculine et féminine (ex.  les sénateur.rice.s,); l’invention et l’emploi de formes nouvelles à la fois féminine et masculine (ex. ilelle, elil pour elle et il).

L’introduction de nouvelles formes de mots grammaticaux comme des pronoms, appartenant à la classe de mots fermée, se révèle très difficile à se faire accepter par le marché linguistique. D’autre part, les formes inclusives utilisant des points médians sont en fait imprononçables pour la plupart et fonctionnent orthographiquement comme des abréviations, qu’il faut développer dans une lecture orale comme dans les sénateur.rice.s lu comme les sénateurs et les sénatrices ou comme les sénatrices et les sénateurs, ce qui repose le problème de l’ordre des formes masculines et féminines. En lecture silencieuse par contre, la forme inclusive fonctionne soit comme une abréviation, un idéogramme, qui ne demande pas à être développé, ce qui ne pose alors plus de problème de préséance, soit être lu sous une seule des formes possibles selon la préférence du lecteur, soit encore être appréhendé silencieusement sous une forme hybride.

Conclusion

La lecture d’un texte a évolué considérablement depuis un siècle. De la lettre manuscrite au smartphone, en passant par la machine à écrire mécanique, le traitement de texte sur ordinateur et les logiciels de messagerie, la lecture silencieuse a dû évoluer progressivement pour laisser plus de place aux idéogrammes, intégrés ou non dans un texte orthographique classique. La vitesse de lecture par sous-vocalisation, devenant au moins partiellement indépendante de la reconstitution d’une structure prosodique, peut donc être plus rapide, au prix d’une simplification et d’une standardisation de l’accès au sens, les dépendances et hiérarchisation entre mots et groupes de mots se trouvant partiellement ou complètement escamotés. Les logiciels d’analyse sémantique, opérant par mots clés déterminés après apprentissage, ne font qu’aggraver cette tendance, pour laquelle les nuances et les subtilités que peuvent contenir un texte s’estompent progressivement. On peut en constater les dégâts dès aujourd’hui.

 


Per citare questo articolo:

Philippe MARTIN, « Un texte écrit n’existe que s’il est lu », Repères DoRiF, n. 25 – Les processus de communication : oralité, écriture, digital, DoRiF Università, Roma, ottobre 2021, https://www.dorif.it/reperes/philippe-martin-un-texte-ecrit-nexiste-que-sil-est-lu/

ISSN 2281-3020

Quest’opera è distribuita con Licenza Creative Commons Attribuzione – Non commerciale – Non opere derivate 3.0 Italia.