Titres et structuration des documen ?· « Titres et structuration des documents » ... projets, description…

  • Published on
    15-Sep-2018

  • View
    213

  • Download
    0

Embed Size (px)

Transcript

<ul><li><p> 1</p><p>Marie-Paule Jacques &amp; Josette Rebeyrolle Titres et structuration des documents </p><p>Schedae</p><p>, 2006, prpublication n1, (fascicule n1, p. 1-12).</p><p>Schedae</p><p>,</p><p> 2006</p><p>Titres et structuration des documents</p><p>Marie-Paule Jacques &amp; Josette Rebeyrolle</p><p>ERSS (UMR5610)/Maison de la Recherche</p><p>Universit Toulouse-Le Mirail 5, alles A. Machado 31058 Toulouse Cedex 9</p><p>mpjacques@univ-tlse2.fr, rebeyrol@univ-tlse2.fr</p><p>Rsum : </p><p>La structuration dun document peut tre assure, entre autres moyens, par un dcoupage en</p><p>sections et sous-sections, gnralement dotes dun titre. Nous nous focalisons sur ces titres et</p><p>sur la faon dont, en plus dassurer la segmentation et lorganisation visuelle du texte, ils contri-</p><p>buent la construction de son contenu smantique. Nos travaux antrieurs nous ayant permis de</p><p>dgager deux grands types dimplication des titres dans cette construction, la question essen-</p><p>tielle est ici de mettre au jour les corrlats formels qui permettent de distinguer ces deux types</p><p>dimplication et de montrer que selon le registre de textes limplication des titres est diffrente.</p><p>Mots-cls : titres, document, linguistique du discours, structuration du texte, analyse de </p><p>corpus.</p><p>Abstract :</p><p>Textual organization of a document includes material characteristics such as sections which usu-</p><p>ally have a heading. We are particularly interested in headings and especially in how headings</p><p>contribute to the construction of the meaning of a text. In previous work a functional approach of</p><p>headings was presented in detail. In the present paper, our study is meant to identify in corpora</p><p>linguistic correlates of the two types of heading implication in discourse : referential/thematic. The</p><p>final corpus analysis shows how the headings are distributed in the texts of the corpus.</p><p>Keywords : headings, document, discourse linguistics, text structure, corpus analysis.</p><p>Sommairement</p><p>Sans entrer dans la dlicate question de dfinir rigoureusement ce quest un docu-</p><p>ment</p><p>1</p><p>, nous considrerons quun document crit est un texte i. qui forme un tout (mme</p><p>si lon peut y reprer une certaine intertextualit et/ou des rfrences et renvois dautres</p><p>documents), ii. qui prsente une organisation interne, notamment dans le cas de ce que</p><p>Prpublication n 1 Fascicule n 1</p><p>1. Voir la rflexion de Roger T. Pdauque (2003), </p><p>Document : forme, signe et mdium, les re-formulations dunumrique</p><p>, disponible sur http://archivesic.ccsd.cnrs.fr/sic_00000413.html page consulte le 13-05-06.</p></li><li><p> 2</p><p>Schedae</p><p>,</p><p> 2006, prpublication n1, (fascicule n1, p. 1-12).</p><p>lon peut appeler des documents longs tels que rapports, thses, articles scientifiques,</p><p>ouvrages, etc.</p><p>Nous proposons ici une analyse descriptive de ce que nous pensons tre des consti-</p><p>tuants essentiels de cette structuration : les titres de section. La suite explique moins som-</p><p>mairement la problmatique.</p><p>Le document : un tout structur</p><p>Aux deux caractristiques formelles du document postules ci-dessus correspondent</p><p>deux proprits smantiques : un document prsente un niveau de contenu smantique</p><p>et, simultanment, un niveau abstrait de structuration de ce contenu. Nous voulons dire</p><p>par l que le document ne dlivre pas son contenu smantique en vrac , mais comme</p><p>contenu organis, structur, hirarchis. Cest de cet ensemble que le lecteur construit un</p><p>discours, cest--dire un modle mental de ce qui est en train de snoncer, au fur et </p><p>mesure quil lit le document.</p><p>Divers modes de structuration discursive font lobjet de recherches, notamment les</p><p>moyens de cohsion lexicale, qui construisent des chanes rfrentielles (Cornish 2003) ou</p><p>les expressions introductrices de cadres de discours, qui construisent des univers de dis-</p><p>cours particuliers, les cadres : plusieurs propositions apparaissant dans le fil dun texte</p><p>entretiennent un mme rapport avec un certain critre et sont, de ce fait, regroupables </p><p>lintrieur dunits que nous appellerons des </p><p>cadres</p><p>. (Charolles 1997). ct de ceux-l,</p><p>dautres moyens de structuration discursive sont encore assez peu tudis comme tels,</p><p>hormis par le mme M. Charolles (2002). Il sagit de la segmentation </p><p>matrielle</p><p> du texte</p><p>crit en paragraphes, sections et sous-sections, ces dernires tant gnralement dotes</p><p>dun titre.</p><p>Ce dcoupage fournit au lecteur une structuration visuelle du texte qui, avant mme</p><p>dentrer dans son contenu, lui permet de commencer construire la structuration discursive :</p><p>le lecteur peroit des blocs, des enchssements, quil peut utiliser comme autant de cases</p><p>de lesprit </p><p>2</p><p> dans lesquelles classer les lments du discours en train de se construire. Et</p><p>si les segments perceptibles visuellement sont titrs, alors les diffrents blocs ne constituent</p><p>plus danonymes tagres ou tiroirs pour ordonner le propos, classer et ranger les lments</p><p>du discours, ils tirent aussi de leur titre dautres lments pour la structuration, qui sont pr-</p><p>cisment lobjet de notre tude.</p><p>Nous avons fait remarquer que ces moyens visuels dorganisation du texte nont gure</p><p>t tudis en tant que moyens de structuration discursive, ce qui ne veut pas dire quils nont</p><p>pas t tudis du tout. Au contraire, le Modle dArchitecture Textuelle (Luc &amp; Virbel 2001)</p><p>est un cadre thorique qui rend compte du fait que, tout texte crit tant inscrit sur un </p><p>sup-</p><p>port</p><p>, il possde des caractristiques matrielles qui peuvent jouer un rle au plan textuel</p><p>(plus rcemment, voir aussi le travail de Power, Scott &amp; Bouyad-Agah 2003). Par exemple,</p><p>on peut raliser une numration de diverses manires, en utilisant des marqueurs lexicaux</p><p>du type </p><p>le premier, le deuxime, le troisime</p><p>, ou bien en utilisant exclusivement des moyens</p><p>visuels : disposition dans lespace du support, indentation, puces ou numros La figure</p><p>ci-dessous reprsente ces deux types dnumration.</p><p>2. Prcisons que cette expression ne vhicule aucune hypothse sur notre conception de lesprit. Nous lareprenons dune communication dAnne Le Draoulec, qui elle-mme lemprunte Heinrich Weil (1844), </p><p>Delordre des mots dans les langues anciennes compares aux langues modernes. Question de grammairegnrale</p><p>. Paris, Didier rudition, rdition 1991.</p></li><li><p> 3</p><p>Schedae</p><p>,</p><p> 2006, prpublication n1, (fascicule n1, p. 1-12).</p><p>En prenant cette matrialit au srieux, autrement dit en en faisant une composante </p><p>part entire du texte, le Modle dArchitecture Textuelle dfinit des objets textuels qui se</p><p>caractrisent par un contraste de mise en forme matrielle avec le reste du texte et par une</p><p>fonction au sein du texte. Sans dvelopper outre mesure, parmi les objets textuels identi-</p><p>fis dans le cadre de ce modle, citons dans le dsordre les numrations, les paragraphes,</p><p>les titres.</p><p>Dans cet ensemble plus vaste que ces quelques exemples, nous nous focalisons sur</p><p>les titres de section car ils prsentent la particularit dtre un objet deux faces.</p><p>Les titres de section, objet deux faces</p><p>Lune de leurs faces est constitue de cette proprit matrielle dtre un objet con-</p><p>trastant avec le reste du texte et oprant ainsi une segmentation, une dlimitation en sec-</p><p>tions, sous-sections, sous-sous-sections, etc. Notons que les sparations ainsi marques ne</p><p>sont pas de simples bornes de segments de textes car les titres sont hirarchiss une hi-</p><p>rarchie elle aussi marque par des moyens typo-dispositionnels et cette hirarchisation se</p><p>rpercute sur les sections titres. De ce fait, nous lavons dj soulign, le texte peut tre</p><p>apprhend non comme une suite linaire de blocs de natures diverses, mais comme une</p><p>structure faite dlments de plus haut niveau englobant dautres lments, hirarchie qui</p><p>nest assurment pas neutre.</p><p>Les titres prsentent aussi une seconde face, non plus matrielle mais smantique, lie</p><p>au fait que les titres sont composs dunits lexicales et syntaxiques, porteuses elles-mmes</p><p>dune signification. Ce qui implique que les titres participent doublement la construction</p><p>de la smantique du document, non seulement ils segmentent et hirarchisent, mais leur</p><p>propre contenu smantique interagit avec le contenu smantique du reste du texte. En un</p><p>certain sens, les titres sont la fois </p><p>dans</p><p> et </p><p>hors</p><p> du texte. </p><p>Dans</p><p> parce que nous allons mon-</p><p>trer maintenant quils sont partie prenante du contenu du texte, quils remplissent certaines</p><p>fonctions discursives ; </p><p>hors</p><p> parce quils ont ce statut particulier de se distinguer du </p><p>corps</p><p>de texte</p><p>, de jouer ce rle dorganisateur textuel visuel.</p><p>Nous exposons maintenant les modalits pratiques de notre tude : quels textes, quelle</p><p>mthodologie ; puis nous indiquerons les rsultats actuels de notre analyse. Dans la der-</p><p>nire partie, nous abordons un autre aspect de notre problmatique : la relation entre forme-</p><p>fonction des titres et registre de textes.</p><p>Mthodologie, corpus et tout a</p><p>Pour comprendre quel est le rle des titres sur le plan de la structuration discursive de</p><p>documents textuels, il est essentiel de disposer de documents textuels dans lesquels il y a</p><p>des titres et dindicateurs de la fonction discursive des titres. Le premier point qui pourrait</p><p>paratre une boutade nen est qu moiti une et nous sert souligner que nous avons rso-</p><p>lument inscrit notre tude dans le cadre dune analyse de corpus, cest--dire que nous avons</p><p>runi un ensemble de textes authentiques, comportant des titres de sections, nous allons</p><p>XXX__________________________________________________________________. Premirement,</p><p>_________________________________________. Deuximement,_______________________________</p><p>_____________________________________________________________________. Troisimement, _____</p><p>________________________________________________________________________.</p><p>XXX___________________________________________________.</p><p>1. ___________________________________________________________</p><p>2. ___________________________________________________________</p><p>3. ___________________________________________________________</p><p>Figure 1 : numrations discursive et visuelle.</p></li><li><p> 4</p><p>Schedae</p><p>,</p><p> 2006, prpublication n1, (fascicule n1, p. 1-12).</p><p>y revenir. Le second point nest pas plus trivial : analyser les fonctions discursives des titres,</p><p>soit, mais avec quels instruments danalyse ? quoi sapprcie le rle jou par un titre au</p><p>niveau discursif ? Les deux choses sont lies dans la mesure o le type de support de lana-</p><p>lyse dtermine en partie le type dindicateurs.</p><p>Nous avons runi trois ensembles de textes de provenances diverses : articles scienti-</p><p>fiques des domaines de lingnierie des connaissances et de la gopolitique ; crits labo-</p><p>rs dans un cadre professionnel de gestion des dplacements : comptes rendus, rapports,</p><p>projets, description de tches Ce corpus a t constitu de telle manire que chaque</p><p>ensemble prsente un nombre quivalent de titres de section, pas tout fait 350 pour cha-</p><p>que, avec un total de 1 041 titres.</p><p>Si nous avions suivi une faon de faire bien tablie dans les tudes sur le discours, nous</p><p>aurions travaill lidentification des fonctions des titres partir dun petit nombre dexem-</p><p>ples, authentiques ou fabriqus pour nos besoins, dont nous aurions propos un classement</p><p>de nature illustrer des fonctions discursives. Le nombre considr ici se prte une autre</p><p>dmarche : non un classement global de chaque titre selon linterprtation que lon peut en</p><p>donner, mais une saisie plus analytique de traits formels. Cette dmarche rpond diverses</p><p>exigences :</p><p>1 plus on sappuie sur des traits formels, moins on fait entrer en jeu la subjecti-</p><p>vit et donc la dpendance dun jugement lgard dun analyste ;</p><p>2 on peut saisir ainsi plus facilement les variations qui ne concernent quun ou</p><p>deux des traits pris en considration, ce qui nest gure facile lorsque le classe-</p><p>ment repose sur un jugement global ;</p><p>3 on obtient une quantification de chaque trait, partir de laquelle on peut pro-</p><p>cder des traitements statistiques qui permettent de mesurer les phnom-</p><p>nes de corrlation, de co-variation ou dindpendance ;</p><p>4 les fonctions dcrites le sont non en terme dinterprtation, mais en terme de</p><p>corrlats linguistiques de nature formelle ;</p><p>5 il est possible de faire merger diverses configurations de traits statistiquement</p><p>valides et de les mettre en rapport avec le genre de textes, comme on le verra</p><p>dans la dernire partie de larticle.</p><p>La cl de vote de la dmarche rside alors dans le choix des traits formels prendre</p><p>en considration. Comme notre analyse vise les fonctions discursives des titres et la faon</p><p>dont ils contribuent lorganisation du discours et la construction de la smantique du texte,</p><p>les traits choisis concernent dune part des lments factuels lis au titre indpendamment</p><p>de son co-texte, tels que la forme et le niveau du titre (par exemple, SN, SV, SP, niveau 1,</p><p>2, 3 ou 4), dautre part des lments co-textuels que nous supposons aptes saisir la faon</p><p>dont le titre sintgre au texte, tels que le fait que le titre ait t pralablement introduit</p><p>dans le discours et/ou quil fasse lobjet dune reprise anaphorique.</p><p>Sagissant des premiers, outre la catgorie grammaticale (SN, SV, SP, phrase), nous</p><p>avons not si le titre prsente une partition interne telle quune coordination, par exemple :</p><p>Nature des savoirs et type de connaissance</p><p>ou une ponctuation, par exemple :</p><p>1. Deux grandes approches : louverture ou la substitution aux importations.</p><p>Ceci nous permet de distinguer ce que nous avons appel les titres bipartites des titres</p><p>qui sont forms dun bloc syntaxique unique comme </p><p>La question agricole</p><p> ou </p><p>Penser la guerre</p><p>totale</p><p>.</p><p>Pour ce qui est des seconds, notre description la plus aboutie ce jour porte sur les</p><p>reprises. Lorsque le titre fait lobjet dune anaphore, on note :</p></li><li><p> 5</p><p>Schedae</p><p>,</p><p> 2006, prpublication n1, (fascicule n1, p. 1-12).</p><p> la forme de la reprise :</p><p> strictement identique ; la totalit du lexique du titre mais pas ncessairement lidentique ; une partie seulement du titre ; un pronom ; une phrase prsentative ou autre (</p><p>il sagit</p><p>).</p><p> l parpillement de la reprise : reprise unique ou reprises des endroits pars ;</p><p> une ventuelle conversion, par ex. </p><p>comparaison</p><p> repris par le verbe </p><p>comparer</p><p>;</p><p> la localisation de la reprise :</p><p> 1</p><p>re</p><p> phrase de la section ; ailleurs dans le paragraphe.</p><p> la position sujet ou non de la reprise ;</p><p> la prsence dun autre titre et une ventuelle reprise dans cet autre titre.</p><p>Lannotation de ces modalits de reprise nous permet de construire un modle tho-</p><p>rique des fonctions des titres. Nous exposons maintenant ce modle tel quil sest labor</p><p>au fur et mesure de lanalyse des titres, et dans la section suivante, nous montrerons com-</p><p>ment lanalyse statistique corrobore en partie ce modle.</p><p>Modle des fonctions discursives des titres</p><p>Pour classer les titres, nous nous appuyons sur leur type dimplication dans lorganisa-</p><p>tion du contenu textuel (cf. Ho-Dac, Jacques &amp; Rebeyrolle 2004 (classification inspire de</p><p>Halliday 1985)). Et nous distinguons deux grands types dimplication : une implication rf-</p><p>rentielle, cest--dire une contribution du titre la gestion des rfrents du discours, et une</p><p>implication thmatique, cest--dire une dlimitation du thme gnral dans lequel sinscrit</p><p>ce dont on va parler : un domaine dactivit, un domaine de connaissances, un point de vue,</p><p>une situation spatio-temporelle, etc., spcifiques. Ces deux ples renvoient des processus</p><p>interprtatifs diffrents : il sagit dans...</p></li></ul>