Introduction

Unlike sentences and (to a lesser extent) chapter, paragraphs remain an understudied scale of prose writing. We all know they exist – we all write paragraphs all the time – but we don’t really know how they work.

Algee-Hewitt, Heuser & Moretti 2015 : 4-5.

À LÉCRIT, LE PARAGRAPHE SIMPOSE à la fois comme une évidence et comme un objet flou. Une certaine confusion entoure, en effet, les notions d’alinéa et de paragraphe et, par ailleurs, en dépit de la vi-lisibilité typographique du bloc de texte entre deux alinéas, nombreux sont ceux qui hésitent à considérer le retour à la ligne associé à un changement de paragraphe comme un fait de ponctuation.

Constatant que nous écrivons tous tout le temps des paragraphes, sans vraiment savoir comment ils fonctionnent1, Marc Algee-Hewitt, Ryan Heuser et Franco Moretti peuvent, avec une certaine justesse, déclarer que « les paragraphes demeurent une échelle insuffisamment étudiée de la prose écrite » ; mais prétendre proposer, comme ils l’écrivent, « un nouveau niveau intermédiaire d’étude de la littérature2 » est assurément une affirmation excessive. Le paragraphe est devenu une unité d’analyse des données textuelles (ADT) depuis un certain temps déjà, comme le prouvent, par exemple, les travaux de Ghassan Mourad et Jean-Luc Minel (2000) et le système SemanText développé par Slim Ben Hazez, avec son repérage des phrases d’ouverture de paragraphes. On peut citer encore les travaux d’Evelyne Mounier et Céline Paganelli (2003) ou encore de Sophie Piérard et Yves Bestgen (2005 et 2006).

Comme les chercheurs californiens le remarquent également, le paragraphe est généralement assimilé à la phrase complexe. Cette réduction à l’échelle inférieure de la phrase ou, ailleurs, à l’échelle supérieure du discours est courante. Pour Longacre, par exemple, « un paragraphe ressemble d’un côté à une longue phrase et d’un autre côté à un court discours » (1979 : 116 ; je traduis). Une telle dilution dans une unité inférieure (grande phrase) ou supérieure (petit discours) ne permet pas de définir le paragraphe et de l’étudier comme une unité intermédiaire spécifique de composition des textes écrits. C’est pourtant cette dernière perspective que je vais m’efforcer de développer ici-même, en partant du fait que, comme l’écrit Michael Hoey : « In writing, sentences bunch into conventional unites called paragraphs, paragraphs into chapter, and chapters into books. In our everyday speech and writing, the sentence is only a small cog in a normally much larger machine » (1983 : 1). La tâche de l’analyse de discours et de la linguistique textuelle est de découvrir le fonctionnement de cette « plus vaste machine » à rassembler des groupes de phrases.

La réalité du paragraphe a très tôt été reconnue dans au moins deux domaines : celui de l’enseignement de l’écriture (rhétorique et composition) et, plus récemment, celui de la psychologie cognitive.

Dans The History of the English Paragraph (1894), Edwin Herbert Lewis fait remonter la première approche sérieuse du paragraphe à la dizaine de pages qu’Alexander Bain lui consacre dans son manuel d’English Composition and Rhetoric (1867 : 142-152). Il me paraît nécessaire d’ajouter la troisième section du chapitre 4, sur la composition, de The Practical Element of Rhetoric (1890 : 193-214), que John F. Genung consacre à une définition et aux principales « sortes de paragraphes ». Depuis, Marc Arabyan (2003 : 13) a recensé, dans le catalogue de la Bibliothèque du Congrès à Washington, plus de cent manuels de composition abordant la question du paragraphe dans les grands genres du discours de l’enseignement (essai, dissertation, mémoire et thèse universitaires, mais aussi synthèse professionnelle). Ricard Ripoll Villanueva (1996) l’a également fait pour quelques manuels d’expression écrite français du début des années 1990. On peut donc dire que, dans le domaine de la didactique de l’écrit, un certain nombre de publications ont très tôt admis l’importance du paragraphe comme unité du discours.

Comme le remarquait Henri Mitterand, on ne peut toutefois pas dresser le même constat dans le domaine de l’enseignement du français :

Trente ans plus tard, la situation ne semble pas s’être améliorée et les linguistes ont certainement une part de responsabilité dans cette affaire. C’est cette prise de conscience qui a motivé à la fois les recherches dont le présent ouvrage présente les résultats et mon attention aux apports de plusieurs disciplines du texte, depuis les travaux expérimentaux de psychologie du langage jusqu’à certaines expérimentations littéraires d’époques différentes.

Le rôle psychocognitif du paragraphe a été reconnu et étudié dès qu’on a commencé à penser que comprendre un texte demande plus que l’interprétation linéaire cumulée de chacune des phrases3 qui le composent. Comprendre un texte passe par la reconnaissance de groupements de propositions par blocs successifs et hiérarchisés autour d’un même thème4, d’une idée commune5 ou d’un même propos6. Richard E. Young, Alton L. Becker et Frank Koen (1966 & 1969) ont démontré la « réalité psychologique du paragraphe ». Dans le domaine de l’intelligence artificielle et de la simulation sur ordinateur de la compréhension de séquences de phrases, Roger C. Schank (1974) s’est tout naturellement intéressé au paragraphe. De nombreux travaux empiriques et expérimentaux ont montré, depuis, que la segmentation typographique de blocs textuels d’énoncés en paragraphes vise à programmer la lecture en donnant des instructions de cycles ou boucles de traitement d’empans textuels successifs. Le découpage d’un texte en paragraphes facilite la construction d’une représentation sémantique, par le maintien temporaire d’informations en mémoire de travail et la mise en relation d’énoncés par étapes de traitement des informations textuelles. En quelque sorte, la linéarité du langage (succession des mots et des phrases graphiques) est compensée par ce moyen de hiérarchisation du sens au sein des unités qui vont du texte à ses différentes parties et chapitres, et aux paragraphes qui les composent.

Alors que cette contrepartie psychologique du paragraphe est bien établie, les linguistes ont été plus hésitants. C’est le sens de la question posée en 1979 par Saiichi Makino : « Paragraph, is it a legitimate linguistic unit ? » Le rejet du paragraphe dans les domaines de la mise en page typographique ou de la stylistique a longtemps permis de répondre négativement à cette question. Pourtant, d’un point de vue linguistique, cette unité de l’écrit présente l’immense intérêt de pouvoir être décrite, dans sa structuration interne, par une linguistique phrastique et périodique ouverte aux enchaînements minimaux de phrases (morphosyntaxe intégrant l’interphrastique). Le paragraphe est l’unité idéale d’observation des phénomènes interphrastiques. En revanche, la succession des paragraphes dans l’unité d’un texte et de ses sous-sections, qui ne peut pas être entièrement décrite selon les mêmes procédures, rend nécessaire le développement d’une théorie du texte qui permette de penser le paragraphe comme une unité transphrastique.

Lorsqu’il se demande lui aussi si le paragraphe est une unité linguistique, Henri Mitterand (1985) apporte une double réponse. Il répond par la négative, selon le point de vue classique de la linguistique du système et de la langue, dont la phrase – ou plutôt la proposition, « niveau catégorématique » de Benveniste – est l’ultime niveau d’analyse « sémiotique ». Sa réponse est en revanche positive du point de vue de la linguistique de l’énonciation et du discours (« sémantique » ou « signifiance du discours »), de ce que Benveniste appelle la « translinguistique des textes, des œuvres7 » (1974 : 66). Confrontés à l’extrême diversité des paragraphes, les linguistes ont été tentés de ranger ces derniers dans la variation idiolectale stylistique, comme cela avait été fait pour la ponctuation phrastique elle-même. Frank Neveu a très bien montré que ce qu’on considère comme « les “incohérences” de la ponctuation sont fréquemment le fait d’une approche grammaticale et non pas discursive du problème » (2014 : 10). C’est toute la différence entre le présent ouvrage et le projet même de « grammaire du paragraphe » de Longacre.

Le paragraphe a tout naturellement été pris en compte par la frange de l’analyse du discours anglo-saxonne qui s’intéresse à l’écrit. Dans « Discourse Analysis8 », Zellig S. Harris, considère les paragraphes et, plus largement, les chapitres comme des « sous-textes […] à l’intérieur du texte principal » qui possèdent « leurs propres classes d’équivalence différentes de celles d’autres sections9 ». Il insiste sur l’étude de la distribution relative des éléments à l’intérieur de ce qu’il appelle des « portions connexes de discours10 ». Il reconnaît qu’en lieu et place de mots ou phrases égarés, perdus (stray words or sentences), le langage se manifeste en portions connexes de discours qui se définissent à la fois par le bornage de leurs frontières et par la connexité qui lie leurs éléments constitutifs.

C’est dans la perspective théorique de la tagmémique de Kenneth Lee Pike que la théorisation du paragraphe s’est surtout développée en Amérique du Nord, en particulier dans les travaux de Robert E. Longacre, qui considère le paragraphe comme une unité grammaticale (1979), propose une typologie des paragraphes (1980) et le définit très clairement comme un niveau de composition situé entre la microsegmentation (phrastique) et la macrosegmentation (textuelle).

Dans le domaine français, les travaux les plus importants sont certainement ceux de Roger Laufer qui a replacé la question du paragraphe et de l’alinéa dans l’histoire du livre et de l’édition et dans ce qu’il appelle « l’énonciation typographique ». Responsable d’un groupe de recherche sur le paragraphe à l’université Paris VIII, Laufer a organisé à la BnF, en février 1982, une table ronde pluridisciplinaire qui est à l’origine du premier volume en langue française exclusivement consacré à La Notion de paragraphe (1985). C’est dans ce volume que Mitterand a publié l’article fondateur déjà cité plus haut et auquel je fais allusion dans la dédicace de ce livre.

Il faut également citer un article de Daniel Bessonnat, paru dans le numéro 57 de la revue Pratiques (1988). Cette étude consacrée au « découpage en paragraphes et ses fonctions » articule magistralement les points de vue historique, psycho-cognitif, didactique et linguistique, en prenant appui sur les travaux de Longacre. Dans ce même volume, il faut également citer un article programmatique de Michel Charolles sur « Les plans d’organisation textuelle. Périodes, chaînes, portées et séquences », qui accorde une place aux paragraphes en les considérant, avec les titres et intertitres, comme des « séquences » ou segments textuels qui facilitent le travail interprétatif. Bessonnat et Charolles développent une approche pragmatique du paragraphe qui insiste sur ses dimensions instructionnelle et métadiscursive. Dans ce sens ils accomplissent une part importante du programme fixé par Mitterand quand il parlait de « la nécessité de prendre en considération le paragraphe […] comme unité pragmatique du discours11 » (1985 : 88).

Parmi les travaux récents et plus systématiques sur l’alinéa et la question du paragraphe, il faut avant tout mentionner ceux de Marc Arabyan. Le fondateur des éditions Lambert-Lucas est, dans l’aire francophone, un des rares chercheurs à avoir dirigé un numéro de revue linguistique entièrement consacré au paragraphe (Modèles linguistiques 48, 2003). Son approche historique et sémiologique est intéressante par l’ampleur de ses corpus (du Moyen Âge à nos jours) et par sa très bonne connaissance des travaux existants. Après sa thèse sur Le Paragraphe narratif (1994), qui s’impose comme la première étude en langue française de cette question, Arabyan a publié Des lettres de l’alphabet à l’image du texte (2012) et plusieurs articles importants qui portent sur les problèmes qui seront ici abordés. « Pour une linguistique du paragraphe » (Arabyan 2016) et une partie du livre de 2012 sont surtout centrés sur la fine distinction qu’il établit entre paragraphes narratifs et paragraphes argumentatifs.

S’inspirant de l’article de Mitterand, Joëlle Gardes Tamine et Marie-Antoinette Pellizza consacrent un chapitre de La Construction du texte (1998 : 70-88) à la définition du paragraphe et à une proposition de typologie qui distingue, à la suite de Mitterand (1985 : 88-90), des paragraphes thématiques, des paragraphes énonciatifs et des paragraphes génériques. Alors que le paragraphe est abordé de façon conséquente dans ce manuel à visée stylistique et littéraire, il n’en est plus question que très allusivement dans Pour une grammaire de l’écrit de Joëlle Gardes Tamine (2004). Ce retrait me semble révélateur du traitement du paragraphe par les linguistes français12.

Par rapport à ces travaux qu’il n’est pas permis d’ignorer, le présent ouvrage s’inscrit résolument dans le cadre de la conception de la linguistique textuelle exposée dans La Linguistique textuelle. Introduction à l’analyse textuelle des discours (Adam 2011) et dans le prolongement de la théorie des séquences textuelles développée dans Les Textes : types et prototypes (2017). Cette position théorique et méthodologique permet d’intégrer dans une approche globale un certain nombre de travaux antérieurs, issus de domaines disciplinaires et de traditions très différentes.

Le peu d’intérêt des linguistes pour le paragraphe est d’autant plus étonnant qu’il s’agit d’un poste d’observation idéal des liages interphrastiques et du passage de la phrase au texte. En effet, après avoir été reconnue comme telle, sur la base d’un traitement morphosyntaxique, une phrase n’est pas « immédiatement traitée dans une perspective textuelle globale », comme le dit un peu rapidement Pierre Le Goffic (2011 : 15), qui n’accorde d’ailleurs aucune place au paragraphe dans son « module textuel ». Lire un texte, ce n’est pas interpréter l’une après l’autre une suite linéaire de propositions et de phrases, mais regrouper des informations en blocs hiérarchisés de sens. Les psychologues parlent de « chunking » (opération de fragmentation et de regroupement structuré de l’information) pour désigner ces opérations de constitutions de blocs de sens (chunks) au niveau de la mémoire immédiate et à court terme (Miller 1956). Le paragraphe est la trace graphique de cette opération transphrastique de regroupement de propositions et de phrases en vue de constituer une unité significative de second niveau (si l’on considère la phrase comme un premier niveau de structuration selon des patrons graphiques et morphosyntaxiques propres à chaque langue) et de premier palier textuel de composition. En effet, cette unité typographique et sémantique est destinée à entrer elle-même dans une structuration compositionnelle d’un niveau supérieur de plus ou moins grande complexité (selon le nombre de niveaux hiérarchiques combinés).

Comme Robert E. Longacre (1992 : 112 & 114), Teun A. van Dijk situe le paragraphe à un « meso-level between the unit of clause or sentence […] and the unit of a text, discourse, or conversation as a whole » (1981 : 177). Poursuivant dans ce sens, Ohori, Takahashi, Yamada & Yanagiya font du paragraphe une unité de discours située à un niveau médian : « between micro- and macro-structures » (1986 : 25). Mitterand le disait très simplement au même moment, en parlant du paragraphe comme d’un « palier structurel intermédiaire entre la phrase et le texte » (1985 : 88). C’est très précisément l’approfondissement de cette hypothèse d’un palier mésotextuel de structuration que le présent ouvrage se fixe comme objet.

La position ici adoptée est très proche de ce que dit Nina Catach de la conception de « l’unité de pensée totale » et du texte du XVIIIe siècle, fondée sur une certaine conception de la période oratoire :

C’est par facilité qu’on dit qu’un paragraphe est composé de n-phrases. On devrait plutôt dire : « Des phrases, non : des propositions, elles-mêmes intégrées les unes aux autres, oui » (Catach 1987 : 44). C’est la définition que je donne de l’unité textuelle élémentaire dans La Linguistique textuelle (2011 : 81-102) en parlant de « proposition énoncée », en critiquant la notion de phrase et en redonnant à la période son importance tant dans les structurations logiques que rythmiques de groupes de propositions.

Comme je l’ai dit plus haut, je n’hésiterai toutefois pas à parler ici-même de « phrase », mais ce sera toujours au sens typographique d’une unité textuelle d’énonciation comprise entre une lettre majuscule et un point final. Cette définition peut être également étendue au paragraphe quand la majuscule est précédée d’un blanc d’alinéa (avec ou sans retrait) et le point final suivi d’un blanc et d’un passage à la ligne (ligne creuse).

Ces phrases graphiques correspondent à des réalités morphosyntaxiques extrêmement variées : phrases monorhèmes, phrases nominales, phrases simples, phrases complexes (un ou plusieurs noyaux et des éléments syntaxiques périphériques), phrases périodiques groupant plusieurs noyaux syntaxiques, voire plusieurs unités phrastiques séparées par un point-virgule ou un double point. Les usages du paragraphe sont également extrêmement variés et il nous faudra bien admettre que, pour ces unités linguistiques comme pour les autres, « la variation n’est pas un accident marginal, mais un mode de fonctionnement ordinaire du système » (Berrendonner & Béguelin 1989 : 124).

En dépit de la reconnaissance de l’autonomie de l’écrit par rapport au langage oral, dans leur Grammaire de l’intonation fondée sur un corpus exclusivement oral, Mary-Annick Morel et Laurent Danon-Boileau accordent une place importante à ce qu’ils appellent, par analogie avec l’écrit, le « paragraphe oral » :

Ils font de ce « paragraphe oral » l’unité d’analyse de la parole spontanée et ils le considèrent comme l’unité grammaticalisable maximale. Bien que Longacre parle lui aussi de « grammaire du paragraphe », j’éviterai d’employer ce terme en raison de la très grande liberté et variété des constructions observables de ces blocs typographiques de sens. À l’opposé de Kaplan et de son « typical English paragraph », qui confère au paragraphe une structure compositionnelle fixe, par rapport à laquelle les autres constructions sont jugées plus ou moins déviantes, je propose de définir le paragraphe comme une unité discursive qui fait sens textuellement, dans le plein exercice de l’énonciation-interaction écrite.

Je pense comme Morel et Danon-Boileau que l’identification des paragraphes passe par des indices suprasegmentaux (1998 : 22) : à savoir les traces graphiques de l’alinéa et du blanc à l’écrit et, à l’oral, la démarcation des paragraphes intonatifs « par la chute conjointe de la mélodie et de l’intensité sur la syllabe finale » (Morel 2011 : 111). Les indices segmentaux (marqueurs lexicaux et morphosyntaxiques) « permettent pour leur part de déterminer la nature des constituants discursifs à l’intérieur du paragraphe » (ibid.), à savoir, à l’oral, le Préambule, le Rhème et, facultativement, un Postrhème. Cela ne signifie pas pour autant que le paragraphe écrit et le « paragraphe oral » sont réductibles l’un à l’autre. Il faut, en effet, affirmer clairement, avec Antoine Culioli, que :

Le paragraphe est précisément une unité propre à l’écrit et doit donc être, avec l’étude de la ponctuation scripturale, un objet d’étude en soi.

Béguelin et Berrendonner, qui ne reconnaissent que la stabilité d’îlots syntaxiques et prosodiques, parlent, eux aussi, de « paragraphes tonaux » :

Autre grande spécialiste de l’oral, Claire Blanche-Benveniste reconnaissait également que « la syntaxe de la phrase et des propositions, fondée sur les catégories grammaticales et leurs fonctions, ne suffit pas à rendre compte de certaines organisations de la langue parlée, pas plus qu’elle ne pourrait décrire totalement les articulations des grandes périodes écrites […] » (1997 : 111). On peut dire la même chose du paragraphe et c’est précisément là que cet objet d’étude devient très intéressant. Je considèrerai donc le paragraphe comme une unité discursive dont la structure interne peut être partiellement décrite, dans ses multiples variations, à l’aide des grammaires de la proposition (ou clause), de la phrase, de la période et de l’interphrastique (anaphores, connecteurs, etc.). En revanche, l’articulation textuelle des suites de paragraphes doit être pensée dans un cadre linguistique élargi.

Je montrerai que le paragraphe peut être théorisé dans le cadre de la double problématique des opérations de segmentation (entailles de la ponctuation) et des opérations de liage des unités de sens à trois niveaux ou paliers de textualisation : microtextuel, mésotextuel et macrotextuel. La théorie des séquences (narratives, descriptives, argumentatives, explicatives et dialogales) exposée dans Les Textes : types et prototypes (Adam 2017) était une première théorisation du niveau transphrastique intermédiaire – mésotextuel – de structuration des grands ensembles verbaux, mais il restait à accorder une place au paragraphe dans cette théorie d’ensemble. Tel est l’objectif de ce livre qui tient compte de cette mise en garde d’Antoine Culioli :

En d’autres termes, le paragraphe doit être pensé dans un cadre linguistique élargi : celui de la linguistique du discours et de la « translinguistique des textes, des œuvres » postulée par Benveniste et pressentie par Mitterand, quand il sous-titrait programmatiquement la seconde partie de son article de 1985 : « Pour une linguistique textuelle du paragraphe ».

Comme le montrera le chapitre 1, les avancées des recherches anglo-saxonnes, espagnoles et de langue française, auxquelles je viens de faire allusion, nous fournissent aujourd’hui assez d’observations et d’efforts de conceptualisation pour nous permettre de proposer une théorie générale du paragraphe qui le constitue en unité d’analyse linguistique des faits de discours.

La première partie fera le bilan des travaux existants dans différents domaines (chapitre 1). À partir de cet état des lieux, je formulerai les propositions théoriques (chapitre 2) que la deuxième partie aura pour but de mettre à l’épreuve de corpus volontairement très variés, tout en explicitant la base des procédures méthodologiques de travail sur des corpus aussi différents. La première partie exploitera surtout le corpus des Petits poèmes en prose de Baudelaire, qui serviront d’exemplification privilégiée, avec quelques textes à visée informative.

La deuxième partie sera consacrée d’abord (chapitre 3) à deux pratiques discursives non artistiques et à différents genres de discours : le rédactionnel publicitaire et les faits divers de la presse écrite, à dominante argumentative pour le premier et narrative pour le second. Un corpus littéraire (dans les chapitres 4 et 5) nous permettra ensuite d’observer la fabrication des paragraphes par les écrivains eux-mêmes et par les éditeurs : nous examinerons le cas d’école de la réécriture de sa Belle au bois dormant par Perrault (chapitre 4.2) et nous verrons comment Albert Camus segmente en paragraphes un passage de La Mort heureuse écrit initialement d’un seul tenant lorsqu’il le reprend dans L’Étranger (chapitre 5.1). La façon dont éditeurs et traducteurs multiplient les paragraphes du Petit Chaperon rouge de Perrault sera l’objet du chapitre 4.3. Certaines expérimentations qui mettent en cause les frontières de la phrase et du paragraphe, dans La Modification et Degrés de Michel Butor, ainsi que La Route des Flandres de Claude Simon, seront abordées dans le chapitre 5.2.

Ce corpus d’exemplification est diachroniquement et génériquement assez varié pour mettre en œuvre et compléter les propositions théoriques du chapitre 2. La plupart de ces analyses seront assez poussées pour mettre en évidence l’articulation entre suites de paragraphes et plans de textes13.