De la notion de thema ou de ce qui est posé dans un texte : là où la sémantique textuelle et l'analyse documentaire se rencontrent

par

Carole Brouillette


Cursus vol.1 no1 (octobre 1995)


Cursus est le périodique électronique étudiant de l'École de bibliothéconomie et des sciences de l'information (EBSI) de l'Université de Montréal. Ce nouveau périodique diffuse des textes produits dans le cadre des cours de l'EBSI.

ISSN 1201-7302

cursus@ere.umontreal.ca
URL:http://www.fas.umontreal.ca/ebsi/cursus/

L'auteure

Carole Brouillette a complété des études en histoire de l'art et en bibliothéconomie. L'analyse de texte et l'indexation de l'image, de même que les théories qui s'y rattachent sont les champs des sciences de l'information qui l'intéressent principalement. Ayant complété un stage de formation à l'Office national du film, elle travaille actuellement chez Provigo pour développer un système de classification intégrant documents administratifs, photographies et vidéos.

De la notion de thema ou de ce qui est posé dans un texte : là où la sémantique textuelle et l'analyse documentaire se rencontrent a été écrit à l'automne 1994 dans le cadre du cours Traitement et représentation des textes (BLT 6251) donné par le professeur Suzanne Bertrand-Gastaldy.

Pour joindre l'auteure : brouilc@war.wyeth.com


Droits d'auteur

Tout texte demeure la propriété de son auteur. La reproduction de ce texte est permise pour une utilisation individuelle. Tout usage commercial nécessite une permission écrite de l'auteur.



INTRODUCTION - UN TEXTE EST UN TEXTE

(...) les yeux ne lisent ni les lettres les unes après les autres, ni les mots les uns après les autres, ni les lignes les unes après les autres, mais procèdent par saccades et fixations, explorant en un même instant la totalité du champ de lecture avec une redondance opiniâtre : parcours incessants ponctués d'arrêts imperceptibles comme si, pour découvrir ce qu'il cherche, l'oeil devait balayer la page avec une agitation intense, non pas régulièrement, à la manière d'un récepteur de télévision (...), mais d'une manière aléatoire, désordonnée, répétitive, ou si l'on préfère, puisque nous sommes en pleine métaphore, comme un pigeon picorant le sol à la recherche de miettes de pain. (Georges Perec 1985, 112-113)

Merci Georges Perec pour l'analogie des miettes de pain faisant du texte un sol où picorer des miettes de sens. Un sol, un ensoi qui n'est pas considéré comme la somme empirique de ses composantes, car là où certains affirment que les mécanismes sémantiques du texte résultent de ceux de la phrase qui eux cumulent ceux des mots, certains proposent d'envisager le texte comme une entité signifiante irréductible (Kristeva 1969, 18 ; van Dijk 1977, 133 ; Eco 1979, 14 ; Rastier 1989, 5).

Principalement au cours des vingt dernières années, certains auteurs ont en effet réfléchi sur la nature du texte et les mécanismes signifiants qui s'y trouvent. Ils ont envisagé les textes comme des entrelacs touffus de signes interdépendants, contextuellement liés. Et de la même manière que l'on ne décrit pas une tapisserie comme une somme de fils de couleurs, plusieurs tenants de la sémantique textuelle refusent dorénavant de considérer le texte comme une addition de mots ou de phrases et orientent leur réflexion sur la nature de la mixture des éléments signifiants. En bref, on pourrait dire qu'ils s'intéressent davantage à l'alchimie qu'aux éléments.

On donnerait donc à un texte un sens différent de celui qui résulterait de l'enchaînement syncopé de chacun des mots qui le constituent. C'est dire que, dans le domaine des sciences de l'information, où ne cessent de proliférer les banques de données textuelles, de telles considérations théoriques méritent d'être étudiées.

Le cheminement de notre réflexion se décrit ainsi : d'abord, nous expliciterons la définition d'interprétation que propose Umberto Eco et sur laquelle nous appuyons notre analyse. Puis nous confronterons les diverses dénominations employées par les auteurs pour traiter du décryptage du sens d'un texte. En soulignant les nuances distinctives de leurs propositions théoriques, nous tâcherons de comprendre pourquoi ce que l'on appelle thema ou encore aboutness demeure si difficile à définir. Plusieurs auteurs ont confirmé l'imprécision de cette notion (Rastier 1989, 54 ; Brown et Yule 1984, 107 ; van Dijk 1977, 127 ; Maron 1977, 40). En guise de conclusion, nous tenterons de voir dans quelle mesure il est possible et surtout pertinent de préciser la notion de thema ou d'aboutness.

Pour les fins de cet état de la question, nous avons choisi de ne retenir que les écrits de certains spécialistes de la sémiotique, plus spécifiquement des gens qui s'intéressent depuis assez longtemps à la problématique de la sémantique textuelle. Bien sûr, il n'est pas question ici de dévaloriser certaines réflexions issues de domaines connexes, mais bien de délimiter l'objet de notre étude. Nous nous sommes donc donné comme directive de décrire la façon dont certains auteurs envisagent ce que les grecs appelaient thema, c'est-à-dire ce qui est posé par le texte et non de répertorier les extensions possibles de ces considérations dans d'autres disciplines.

Umberto Eco s'est trouvé à être le fil conducteur de la mise en place des notions qui définissent la sémantique du texte en raison des nombreuses synthèses dont nous lui sommes redevables à ce propos. Cependant, la contribution d'autres auteurs du domaine est incontournable. Nous en avons tenu compte et, croyonsnous, la matière sur laquelle réfléchir ne s'en trouve que plus riche.

Dernière indication d'ordre méthodologique : nous avons cru bon de considérer des textes d'auteurs d'origines géographiques diverses (Danemark, Écosse, ÉtatsUnis ; France, Italie, PaysBas), les échanges et les citations entre auteurs de la communauté internationnale du domaine étant fréquents. Cependant, ce sont des versions rédigées ou traduites soit en anglais soit en français de leurs textes qui ont été retenues.

1. DE QUELQUES CONSIDÉRATIONS SUR L'INTERPRÉTATION DES TEXTES

Avant de procéder à l'analyse proprement dite du débat entourant la notion de thema, nous avons jugé important de préciser certaines prémisses de l'interprétation textuelle, afin que le lecteur puisse comprendre à partir de quelles considérations générales la définition de ce que l'on appelle thema pour un texte donné est susceptible d'être constituée. Nous avons choisi pour ce faire de résumer une partie des propos tenus par Umberto Eco lors d'un colloque sur la sémiologie du récepteur (Eco 1987, 4a).

1.1 Trois types d'intentions

En matière d'interprétation textuelle, Eco pose le problème suivant :

- doit-on chercher dans le texte ce que l'auteur a voulu dire ?
- doit-on chercher dans le texte ce que le texte dit, indépendamment des intentions de son auteur ?
Et si oui,
- doit-on le faire en se référant à sa propre cohérence textuelle ou alors aux pulsions, aux choix propres du destinataire lui-même ?

Avant de répondre directement à cette question, Eco précise qu'accepter l'idée qu'un texte peut appeler une infinité d'interprétations, ce n'est pas encore avoir décidé si cette infinité dépend de l'intention de l'auteur, de celle de l'oeuvre, ou de celle du lecteur. Par exemple, les cabalistes du Moyen Âge et de la Renaissance affirmaient que le texte de la cabale non seulement admettait une variété infinie d'interprétations, mais qu'il pouvait, et même qu'il devait être indéfiniment réécrit conformément à l'infinité des combinaisons possibles entre les lettres dont il se compose. En ce cas, l'infinité des interprétations, certainement dépendante des initiatives du lecteur, est en outre voulue et planifiée par l'auteur divin. C'est dire qu'il est possible de lire comme infiniment interprétable un texte que son auteur a conçu comme absolument univoque mais que quiconque le veut peut lire comme univoque un texte que son auteur a voulu infiniment interprétable.

1.2 Défense et illustration du sens littéral

Pour illustrer son propos, se voulant une défense du sens littéral du texte par opposition à une certaine dérive interprétative, Eco relate un événement d'actualité : Ronald Reagan, pendant qu'il était en train d'essayer ses micros avant une conférence de presse, a déclaré : " Dans quelques minutes, je donnerai l'ordre de bombarder la Russie ". L'énoncé, interprété selon le code de la langue, signifiait exactement ce qu'il signifie intuitivement. Questionné par les journalistes, Reagan fit savoir qu'il avait plaisanté.

Cet épisode relève encore du type d'interaction conversationnelle ordinaire, composée de textes qui se corrigent les uns les autres, plaçant le lecteur devant une situation de choix par rapport à plusieurs interprétations possibles (c'est l'histoire d'un homme qui plaisante ; c'est l'histoire d'un homme qui plaisante à un moment inopportun ; c'est l'histoire d'un homme qui plaisante pour dissimuler une menace, etc.). Toutefois, pour interpréter cette histoire, pour extrapoler toutes les significations possibles qui s'y rattachent, il faut d'après Eco, retenir que, grammaticalement parlant, le président des États-Unis a dit qu'il avait l'intention de bombarder l'U.R.S.S.

1.3 Interprétation et usage

Eco propose une distinction entre l'interprétation et l'usage d'un texte. Pour illustrer simplement ce qu'il entend par interprétation, il cite deux faits de la littérature :

a. Jacques Derrida a interprété La Lettre volée d'Edgar Allan Poe. Pour mener sa propre lecture psychanalytique, Derrida fait observer qu'il vise à analyser l'inconscient du texte et non l'inconscient de l'auteur. Il s'intéresse à la position de ladite lettre, trouvée à l'intérieur d'un porte-carte suspendu au-dessus de la cheminée par un ruban à un petit bouton de cuivre, etc. Peu importe ici de savoir quelles conclusions il tire de ces indications contenues dans le texte, le fait est que le bouton de cuivre et le centre de la cheminée constituent des éléments de mobilier à l'intérieur du 'monde possible' mis en place par la nouvelle de Poe et que, pour lire cette nouvelle, Derrida a dû respecter non seulement le lexique de la langue anglaise, mais aussi le monde possible que cette nouvelle décrit.

b. Au contraire, Marie Bonaparte a fait usage du texte d'Edgar Allan Poe, en intégrant dans le discours analysé des preuves recueillies à partir d'informations biographiques extracontextuelles (Eco 1987, 20-21).

L'interprétation de Derrida, indépendamment des intentions de Poe, est donc soutenue par le texte même (il n'exclut pas que le point focal de l'histoire est le milieu de la cheminée, au contraire il l'affirme). Si on peut ignorer le point focal au cours d'une première lecture, il est impossible de faire semblant de l'avoir ignoré lorsqu'on parvient à la fin de la nouvelle, à moins de raconter une autre histoire. Eco nomme intentio operis le fait qu'une interprétation paraisse plausible si et seulement si elle ne se trouve pas remise en question par quelque autre passage du texte.

L'intentio operis n'est pas tout : le fait qu'un texte prévoit un lecteur modèle capable de produire une infinité de lectures possibles ne signifie pas que l'oeuvre ne possède pas son propre code sous-jacent. Ce code, c'est cette volonté occulte intentio auctoris - mais qui devient palpable en se traduisant en termes de stratégie textuelle - de produire précisément ce lecteur libre de hasarder toutes les interprétations qu'il veut, mais néanmoins obligé de se réfréner chaque fois que le texte cesse d'approuver (intentio operis) ses trop lointaines élucubrations.

1.4 Contre le principe d'une interprétation " dominante "

Un énoncé de principe émerge donc de cette suite de considérations :
a. un texte doit être pris comme critère de validation de ses propres interprétations ;
b. pour ce faire, on doit admettre la possibilité qu'il existe un langage critique qui fonctionne comme métalangage et qui permette de faire la comparaison entre le texte et la nouvelle interprétation que l'on en propose. En effet, si l'on considère que toute interprétation d'un texte est en quelque sorte une " mésinterprétation ", on risque paradoxalement de laisser entendre que le texte privilégie une interprétation déterminée de préférence aux autres.

1.5 Le texte est un texte (bis)

C'est donc à partir de ces remarques qui placent le texte au centre et non en amont de l'interprétation que nous tenterons de voir en quoi consiste la notion de thema. La raison de cette prise de position est simple : le premier angle est, nous semble-t-il, plus approprié aux sciences de l'information que le second, qui lui, relèverait davantage de la psychologie.

2. DE QUOI DIABLE EST-IL QUESTION DANS CE TEXTE ?

2.1 La thématique - François Rastier

Les réflexions de François Rastier (1989) font suite à une certaine polarisation des théories du langage voulant que l'on affirme soit l'objectivité sans nuance du sens, soit sa subjectivité absolue. Entre l'obsession du texte et l'égarement du lecteur, Rastier nous propose de considérer le sens non pas comme étant dépendant du texte seul, mais bien issu d'une situation de communication comprenant un émetteur, un récepteur et un ensemble de conditions (genre textuel, pratique sociale, etc.).

Cette localisation du sens au coeur d'un échange communicationnel, permet de le considérer comme étant à construire et non donné, fixé une fois pour toutes. Ainsi, si l'objectivation du texte s'appuie sur les composantes matérielles du texte, elle n'est pas garantie par elle. Ce qui permet d'envisager une garantie plausible de l'objectivation dans la conciliation des contraintes imposées par le texte à ses lectures successives avec celles qu'imposent les situations où les lectures sont produites. Il en va ainsi, par exemple du consensus social qui institue la vérité relative du sens pour toutes les unités, du mot (pensons aux dictionnaires) au texte.

L'étude de ce que Rastier appelle la thématique, ou plutôt la nature sémantique de la continuité thématique, laisse justement espérer la possibilité d'un consensus minimal entre récepteurs dans une situation donnée.

De ce fait, Rastier distingue les thèmes génériques des thèmes spécifiques. Les thèmes génériques, dit-il, sont des classes sémantiques se manifestant dans le texte par la récurrence de leurs membres et, éventuellement, par leur dénomination (Rastier 1989, 55) et pouvant prendre trois formes différentes :

  1. thème microgénérique, correspondant à la classe sémantique du taxème, classe minimale où les sémèmes sont interdéfinis : par exemple, 'cigarette', 'cigare', 'pipe' s'opposent au sein du taxème 'tabac.
  2. thème mésogénérique, associé à la classe sémantique plus générale du domaine, incluant plusieurs taxèmes. Il relève de l'expérience du groupe, d'une pratique sociale codifiée : par exemple, les indicateurs lexicographiques comme mar. (marine) ou cuis. (cuisine).
  3. thème macrogénérique, correspondant à la classe sémantique de généralité supérieure que représente la dimension. Les dimensions se reconnaissent par les grandes oppositions qui les articulent : par exemple, 'animé' vs 'inanimé' ; 'animal' vs 'végétal', etc. Et ces oppositions peuvent être lexicalisées : par exemple, respectivement, 'on' vs 'ça' ; 'venimeux' vs ' vénéneux'.

Les thèmes spécifiques, quant à eux, ne sont liés à aucune classe sémantique déterminée. Ainsi, ils commandent une recherche de sèmes spécifiques, indépendamment d'une lexicalisation précise. Or, les textes créent justement par récurrence des groupements de sèmes particuliers, relativement stables, les molécules sémiques (Rastier 1989, 57). L'auteur illustre ces propos avec un regroupement de sèmes tirés de l'Assommoir de Zola : chaud/visqueux/jaune/néfaste, qui se répète tout au long du texte, sans aucune constance lexicale, par des mots comme 'jus', 'pipi', 'sauce', 'morve', 'beurre', 'bedon', 'cuivre', 'huile', 'lune', 'goutte', etc. En d'autres termes, une molécule a le statut d'un type.

D'après l'auteur, seule la sémantique textuelle est susceptible de proposer une description unifiée de ces deux ordres de phénomènes (Rastier 1989, 58).

Exemple : oppositions terminologiques utilisées dans divers domaines :

Sémantique           Thèmes génériques     Thèmes spécifiques

Gestalttheorie fond figures Intelligence artificielle topic focus Critique littéraire sujet thèmes Ancienne rhétorique style lieux

Ces deux espèces de thèmes, génériques et spécifiques, sont, d'après l'auteur, les facteurs primordiaux de la cohésion sémantique, attribut essentiel de la textualité.

2.2 Le topic - Umberto Eco

Là où Rastier parle de thématique, Eco préfère l'expression topic pour une raison d'ordre méthodologique. En effet, pour décrire le schéma hypothétique d'un texte que propose le lecteur, il use du mot topic plutôt que de thème, pour éviter qu'il ne désigne, comme chez certains auteurs (Tomasevskij 1928), le schéma fondamental de la narration, la logique des personnages, le cours des événements ordonnés temporellement. Ce dernier concept, Eco l'appelle la fabula. Et comme la fabula est une part du contenu du texte, c'est sur le topic, qui se veut plutôt un instrument métatextuel, un enregistrement du signifié traduit hors du texte, que nous avons choisi de nous attarder.

Le topic a deux fonctions :

  1. soumettre la sémiosis (interprétabilité) en la réduisant ;
  2. orienter la direction des actualisations.

L'expression suivante illustre bien comment le spectre sémiotique sur lequel ouvre le mot 'aussi' peut devenir obtus lorsqu'on lui assigne un opérateur textuel tel que le topic :

Charles fait l'amour avec sa femme deux fois par semaine. Pierre aussi. (Eco 1985, 112)

L'ambiguïté à savoir s'il est question d'un triangle adultère ou du comportement sexuel de deux couples est levée aussitôt que le topic est désigné. Dans un cas le topic est le rythme sexuel de deux couples ; dans l'autre, les rapports entre une femme et deux hommes.

Deux observations notables découlent de cet exemple :

  1. L'ambiguïté de l'expression ne vient pas directement de l'emploi de 'aussi' ; il n'y aurait pas d'ambiguïté dans le cas suivant :
    Charles promène son chien tous les soirs. Pierre aussi. (Eco 1985, 113)
    Ce qui signifie qu'il y a des scénarios intertextuels qui entrent en jeu à propos des rapports entre hommes et femmes sans valoir pour les animaux domestiques.
  2. Déterminer le topic de la première expression, signifie " avancer une hypothèse sur une certaine régularité de comportement sexuel ". Cette conformité est aussi ce qui fixe tant les limites que la cohérence d'un texte. Soit justement le texte suivant:
Ma moitié vient d'avoir un. Une trique de soprano avec des taches de son. Nez en lame de couteau. Assez gentille à sa manière dans une petite romance. Pas de gosier. (Joyce, Ulysse).

Si on convient de définir le topic de ce texte comme étant la libre association d'idées dans l'esprit de Léopold Bloom, la cohérence subsiste. Eco, après avoir défini la notion de topic et explicité son rôle sémantique, s'attarde sur la façon de le déterminer. Le titre est souvent le signal (sauf comme c'est souvent le cas en littérature, lorsque l'auteur se prête à un jeu sur les conventions narratives dans le but de les remettre en question) tout comme la réitération très évidente d'expressions clefs, soit éparpillées largement, soit disposées à des endroits stratégiques du texte. Et bien sûr, malgré que l'on tienne compte de ces indices, l'hypothèse peut, en cours de lecture, se révéler fausse. C'est pourquoi, surtout quand un texte est complexe, la lecture n'est pas linéaire, elle appelle à un regard en arrière, à une lecture à rebours, etc.

Finalement, Eco mentionne qu'un texte n'est pas contraint à un seul topic. Le texte peut assumer une certaine hiérarchie de topics : depuis les topics de phrases jusqu'aux topics discursifs, puis aux topics narratifs et aux macrotopics qui les englobent tous.

2.3 La macro-structure - Teun A. van Dijk

Postulant que la linéarité, de même que la cohérence du discours en général, est déterminée par un topic englobant, van Dijk a justement suggéré que le topic soit défini au niveau des macro-structures (structure globale d'une séquence de propositions discursives) par opposition à celui des micro-structures (structure locale d'une proposition discursive) (Van Dijk 1977).

De la même façon qu'Eco, van Dijk postule qu'un topic régularise la cohérence du discours dans son ensemble (overall). En d'autres mots, une séquence de propositions ne soutient convenablement un discours que si cette séquence est cohérente dans son ensemble. Soit le texte :

I bought a book in the bookshop this morning. The bookshop has been rented by a French woman. French women are usually welldressed. My sister dresses well, ... (Van Dijk 1977)

À moins d'avoir identifié un topic semblable à celui décrit par Eco pour l'oeuvre de Joyce, cette séquence, bien qu'elle soit cohérente dans sa succession linéaire, n'est pas globalement cohérente.

Dans le but de décrire plus à fond la notion de macro-structures, van Dijk décortique le processus de leur découverte en quatre macro-règles (les textes cités en exemple sont de Van Dijk) :

  1. Effacement (deletion) Cette règle implique que l'on puisse éclipser d'un texte toutes les propositions qui ne sont pas nécessaires à l'interprétation de propositions subséquentes. Cette règle pourrait s'appliquer, dans l'exemple suivant, à la proposition 'red', non essentielle à la compréhension : Mary was playing with a red ball. The ball smashed a window.
  2. Généralisation La généralisation est en quelque sorte l'opération par laquelle on résume les propriétés qu'ont en commun plusieurs propositions. Par exemple : Mary was playing with her doll house. She played with her blocks, then with her racing cars peuvent être généralisées de la façon suivante : Mary was playing with her toys.
  3. Sélection La sélection se décrit comme l'omission des propositions qui explicitent une proposition ou qui sont implicitement incluses par elles. Dans l'exemple : That day, we went to Paris, In the morning we took a cab to the station, there we took the train on peut sélectionner l'extrait signifiant That day we went to Paris pour représenter les propositions subséquentes qui ont pour rôle de fournir des détails sur ce dernier. De manière générale, on peut effectuer cette sélection pour évacuer des informations qui se veulent des conditions normales ou des préalables, des actions constituantes prévisibles des conséquences normales ou encore des circonstances normales. Cette macro-règle présuppose donc que l'on attribue un poids plus important aux propositions génériques qu'aux propositions partitives.
  4. Construction La construction est l'équivalent de la sélection dans le cas où la proposition sélectionnée n'est pas incluse dans le texte, mais dérivée du texte, construite ad hoc.

Pour représenter la séquence I went to the station. I bought a ticket. I went to the train (...) The train arrived in Paris on construira, par exemple, la proposition I took the train to Paris.

Deux contraintes sont à observer lors de l'utilisation de ces macro-règles : arrêter la généralisation au niveau le plus spécifique de la macro-structure (ex. : ne pas remplacer voyage à Paris par voyage en Europe, etc.) et n'omettre aucune proposition nécessaire à l'interprétation de propositions subséquentes.

Cette construction théorique faite à partir du texte mais en dehors de lui, tout comme le topic d'Eco, démontre bien que même si l'on en venait à réduire une séquence de propositions (discours) à un mot-topic, il faudrait tout de même avoir pris connaissance de la représentation sémantique du discours entier.

2.4 Le topic déterminé par un réseau sémantique - Gillian Brown/George Yule

La notion de proposition mise de l'avant par van Dijk pour exprimer une représentation sémantique d'un texte, est décrite par Brown et Yule comme la traduction d'un texte en un format différent. Le résultat de cette opération, de cette 'réduction' de la représentation sémantique, n'aboutit pas expressément, d'après ces auteurs, au topic d'un discours. Brown et Yule considèrent d'ailleurs que ni la représentation du topic ni la représentation sémantique d'un discours ne dérivent de quelque chose qui soit plus formel que l'interprétation que se fait l'analyste d'un texte. On parle donc ici des topics possibles et non du topic d'un discours. Autre nuance apportée par Brown et Yule : dans la mesure où l'on considère que la représentation d'un texte peut s'exprimer par des propositions, elles-mêmes considérées comme des concepts dans l'esprit du lecteur, on devrait s'attendre à ce que l'analyste puisse non seulement produire une analyse du texte, mais aussi une analyse de la représentation mentale de ce texte. Ce double processus analytique supposerait que l'analyse puisse être bonne non seulement sur le plan concis/exhaustif mais également à titre de réalité psychologique. Mentionnons brièvement à ce propos les recherches de Kintsch concernant la mémorisation des textes et plus précisément son hypothèse voulant que : " the time required to read and remember a paragraph should be proportionnal to the number of propositions in its base " (Kintsch 1974, cité par Brown et Yule 1983, 111).

Les recherches de Kintsch apportent à l'analyse textuelle l'idée que la représentation d'un texte dans notre mémoire ne se résume pas à la somme des propositions que le texte en question est susceptible de contenir, mais plutôt à un certain nombre de relations qui lient ces propositions. Une telle conception de la représentation d'un texte impliquerait donc la subordination de certaines propositions à d'autres, voire une organisation hiérarchique des propositions. Théoriquement, on peut donc imaginer que la proposition occupant la place la plus haute de cette structure hiérarchique pourrait faire office de proposition-topic du texte.

Ce détour méthodologique permet de réintégrer l'idée de van Dijk voulant qu'un ensemble de propositions puisse être exprimé par un topic. Une fois cette distinction faite, Brown et Yule soulèvent un aspect de cette théorie qui limite son application : elle ne se concentre que sur le contenu d'un discours au détriment de tous ses autres aspects, dont, aspect capital d'après les auteurs, le contexte de production du texte (Brown et Yule 1983, 115). L'exemple illustrant les propos des auteurs est le suivant :

He is hungry now.

Cette phrase, dite par Joséphine à propos de Napoléon en 1806, exprime une proposition qui a peu à voir avec celle à laquelle réfèrerait cette phrase dite par un journaliste à propos d'un politicien ambitieux. Cet exemple démontre bien l'insuffisance de l'analyse qui ne s'articule qu'à partir du format ou de la réduction d'un énoncé sans considération pour le contexte d'énonciation.

Après avoir critiqué certains aspects du modèle décrit par van Dijk pour identifier le topic d'un texte, Brown et Yule proposent une autre possibilité. La représentation du topic qu'ils suggèrent relève davantage de l'articulation d'un réseau que d'une proposition synthétique. La notion de topic est donc décrite comme un grand nombre de relations conceptuelles potentielles à l'oeuvre dans le texte. Et advenant le cas où chacune des phrases d'un texte partage un même noeud conceptuel du réseau sémantique, on peut parler de topic. (À ce propos voir l'illustration figurant dans Brown et Yule 1983, 123).

2.5 L'aboutness et la localisation théorique du sujet/W.J. Hutchins

À l'instar de Brown et Yule, Hutchins questionne l'idée voulant que la formulation du sujet d'un texte, de son aboutness, ne soit qu'une affaire de format réduit. D'après lui, la conception traditionnelle d'aboutness voulant que le sujet d'un document s'exprime dans le résumé d'un texte entier, de même que l'indexation par mots-clés qui en découle, sont loin de permettre un repérage qui convienne aux besoins d'un grand nombre d'utilisateurs.

Pour appuyer ces propos, Hutchins fait référence à certains préceptes de la linguistique voulant qu'une phrase contienne une part d'information présumée connue (thème) et une part d'information nouvelle se rapportant au thème (rhème). De la même façon, la première phrase d'un paragraphe peut être considérée comme la phrase thème de cette portion de texte. Et encore, on peut supposer que les phrases du début d'un texte représentent les fondements sur lesquels le reste du texte prend appui. Ces phrases indiquent ce dont il sera question dans le texte, son aboutness, en ce sens qu'elles établissent les postulats de l'auteur, ce qu'il présuppose comme étant su pour amorcer sa réflexion et donc la communiquer à un lecteur.

Conséquemment, Hutchins propose d'associer la notion d'aboutness au savoir antérieur nécessaire à la compréhension d'un texte et non à sa miniaturisation, de telle façon qu'un utilisateur désirant augmenter ses connaissances dans un domaine particulier, puisse juger de la pertinence d'un document en fonction de son niveau de savoir. Voici un exemple qui illustre la nuance mise de l'avant par l'auteur, et qui influence la détermination du sujet d'un texte :

Si, dans son introduction, un auteur mentionne que l'ouvrage porte sur l'archéologie industrielle, généralement l'indexeur retiendra le concept 'archéologie industrielle' pour en résumer le contenu. Cependant, ce descripteur n'indique en aucune façon si le livre traite d'une nouvelle tendance en archéologie industrielle, ou de l'archéologie industrielle en général.

Vu sous cet angle, le sujet ne serait donc pas seulement ce de quoi on parle, l'objet d'une réflexion, mais aussi à partir de quoi on en parle ou son lieu théorique.

2.6 Le domaine notionnel - Georges Vignaux

Les avancées théoriques de Brown et Yule, tout comme celles de Rastier et Hutchins, laissent entendre, comme nous venons de le voir, que le discours est non seulement moyen de représentation mais aussi moyen de communication. Vignaux fonde également son analyse de la structuration des énoncés sur cette prémisse.

Tout énoncé est porteur d'une " orientation " déterminée du fait d'une certaine mise en relation qu'il opère entre différents " repères " linguistiques renvoyant à des acteurs, des choses, des états, des processus, des situations, des domaines. Ce qui importe donc (...) c'est de travailler sur ces types de mises en relation (thématisation, prédication, modalités) grâce auxquels, à chaque fois, des énonciateurs vont " tisser " un jeu structuré de références repérant des " domaines " et des " significations ". (Vignaux 1990, 35)

Vignaux suppose que l'énoncé en cause dans toute activité langagière est orienté puisque destiné à un auditoire (relation prédicative). Cet énoncé, cette construction d'un sujet vis-à-vis d'un référent (voir Fontanille plus loin) procède donc d'un thème de départ (ce qui est thématisé). Un discours se donne donc, vu sous cet angle, comme un " construit " de par les marques sémantiques qu'il cumule et comme un " opérant ", de par les " instructions " de mises en relation qu'il suggère.

Cette dernière caractéristique, ouvrant une voie à la thématisation, renvoie à la logique des propositions, en ce sens qu'elle implique un " jugement " qui ait pour fonction de stabiliser la représentation donnée de certains objets. La thématisation se veut donc ici l'opération par laquelle on pose des " natures " d'objets en situation, impliquant tantôt le renvoi à des schémas mentaux pré-établis, tantôt l'élaboration de " nouveaux construits ".

Pour comprendre les processus à l'oeuvre pour représenter ces " nouveaux construits ", Vignaux propose, en quelque sorte, d'évaluer jusqu'à quel point une référence discursive est incluse dans un champ notionnel défini et jusqu'à quel point elle s'en différencie. L'ajustement serait donc au coeur de l'activité du langage (Culioli cité par Vignaux 1988, 115). Cet ajustement aurait lieu entre la stabilité et la déformabilité d'objets ; entre des espaces de signification fermés, ayant des propriétés soit physiques, soit culturelles et d'autres, encore ouverts, lieux de construction sémantiques en chantier. Ce phénomène de mise au point des références alloue un espace où chaque énonciateur, voire chaque lecteur, est susceptible de communiquer ou constituer sa vision des choses. Ainsi, la réalité, en termes cognitifs, se traduirait par des schémas, jamais tout à fait cristallisés cependant, la liste de leurs propriétés n'incluant jamais toutes celles que l'on pourrait imaginer.

Un énoncé traduira donc certaines frontières entre l'intérieur d'un domaine en regard d'un extérieur, orienté vers un certain point de vue cognitif. Voici, par exemple comment l'auteur identifie ces degrés de variation à l'intérieur d'un texte :

1. L'ancrage dans un domaine
Exemple : Maintenant tout le monde est informatisé.
Localisation : ici
Identification : tout le monde
Détermination : être informatisé
Thématisation générale : X (tout le monde) reçoit Pn (propriété générale informatisation)

En conséquence : être informatisé (frontière de franchissement) devient garant de l'effectivité d'une notion et du savoir global, général associé à cette notion.

2. La transformation du domaine notionnel
Exemple (extrait) : L'erreur n'a plus d'importance parce que c'est tellement facile à corriger... Avant on faisait de la dictée d'un premier jet qui était plus satisfaisant... Alors que maintenant on devient plus exigeant. Pour le moindre mot, ben... on va reprendre une page de texte... Y'a une influence qui peut être très dangereuse à mon sens, c'est que faut faire attention pour ne pas devenir applicateur de formules...
Établissement d'une frontière entre " avant " et " aujourd'hui "
Sélection d'une caractéristique : les fautes de frappes
Prédication d'une propriété nouvelle liée au procès " ça n'a plus d'importance "
Détermination nouvelle : " c'est facile à corriger ".
Autrement dit, la représentation du changement d'état (on s'est informatisé) s'ordonne selon un double processus antagoniste : un processus positif de passage au progrès ; un processus négatif d'inquiétude. Et c'est ce dernier processus qui l'emporte.

2.7 La notion de point de vue - Jacques Fontanille

Vignaux, nous l'avons vu, consent au locuteur un espace où exprimer son point de vue, au point limite où une notion stable peut être transformée. Fontanille développe cette notion de point de vue de telle manière que non seulement l'énonciateur puisse élaborer un point de vue, mais le récepteur également, de même que le texte lui-même ou l'image que l'on en a.

Cette avancée théorique est l'aboutissement d'une analyse méticuleuse que nous ne pourrons ici résumer que dans ses grandes lignes.

Soient les deux définitions en langue naturelle du terme point de vue extraites des dictionnaires Littré et Robert:

Littré :

Point de vue :
Mettre une lunette à son point, donner à une lunette, à un appareil photographique, le degré de longueur nécessaire pour que l'image soit nette.

Robert :

Point de vue :
1. Endroit où l'on doit se placer pour voir un objet le mieux possible
2. Manière particulière dont une question peut être considérée
3. Opinion particulière
4. (Vieux) Endroit où une chose, un objet doit être placé pour être bien vu ; ensemble d'objets, spectacle sur lequel la vue s'arrête.

Dans un premier temps, l'auteur analyse ces deux séries d'acceptions et dresse une liste des différents contenus auxquels elles réfèrent :

  1. deux rôles essentiels, deux actants : le sujet et l'objet ;
  2. un rapport d'adéquation entre les deux actants : la mise au point témoigne d'une interaction qui, dans le meilleur des cas, aboutit à un " réglage " d'un actant par rapport à l'autre ;
  3. un processus de sélection et d'orientation des structures sémantiques ;
  4. une composante spatiale facultative, mais dominante, qui prend en charge figurativement l'interaction entre les deux actants;
  5. une composante perceptive visuelle ou une composante intellectuelle et affective.

Puis il relève les caractéristiques marquant une certaine évolution lexicale entre le Littré et le Robert:

  1. on a généralisé, en passant d'une technique optique à un phénomène perceptif, et d'un phénomène perceptif à un phénomène intellectuel et affectif;
  2. on a extrapolé, à partir d'un savoir-faire technique - le réglage de l'appareil - une compétence cognitive générale du sujet;
  3. on a déplacé le " topic ", de l'objet et de sa position, voire de sa netteté, au sujet, à sa position, à sa compétence, à ses préférences.

Le point de vue et la subjectivité

L'une des principales idées mises de l'avant par l'auteur est celle du point de vue et de l'interaction. Comme on l'a dit plus haut, l'existence d'une composante interactive dans le point de vue est évidente : le sujet se règle sur l'objet, l'objet est plus ou moins bien placé par rapport au sujet. Et dès qu'apparaît l'idée d'interaction, la notion même d'objet fait problème : d'où l'affirmation de l'auteur voulant que dans un point de vue, il n'y ait pas un pôle inerte (objet) et un pôle dynamique (le sujet), mais deux pôles interactifs. D'où les différents passages d'objet à sujet que propose l'auteur :

  1. La transformation de l'objet cognitif en informateur: L'objet contraint l'observateur à adopter une certaine position, un certain regard, et cette contrainte, qui présuppose une manipulation, présuppose finalement l'activité et la compétence d'un informateur. " Albertine, chez Proust, devient l'informateur du moment où elle comprend qu'on l'observe ; ou plutôt, tout se passe comme si, une fois qu'elle a été observée 'innocemment' une première fois, elle avait compris qu'elle était source d'information pour Marcel. "
  2. La transformation du personnage objet de savoir en sujet observateur : "Lorsque le déplacement d'un observateur dans un paysage n'affecte pas l'homogénéité de l'informateur, celui-ci passe pour un sujet constant et organisateur, alors que l'observateur, en ses positions successives est une machine enregistreuse soumise aux conditions de l'autre ; inversement, si l'informateur éclate en ses multiples aspects, l'observateur s'affirme comme sujet ".
  3. L'émergence du sujet à partir de l'objet: " N'importe quel objet de quête est susceptible d'être reconnu comme sujet - au moins comme anti-sujet - dès lors qu'il résiste : quels obstacles, quels objets ne se voient pas traités comme sujets par un sujet de quête exaspéré?"
  4. Pour une syntaxe des points de vue : La conversion d'actants, qui engendrent les zones d'interaction, a la conséquence suivante : la dimension cognitive est syntaxiquement organisée par l'apparition et la disparition de ces interactions, par la construction et la déconstruction des hyper-savoirs appartenant à la compétence des sujets. Par exemple, un narrateur qui apparaissait comme donné et reçu est considéré comme produit fabriqué par un sujet cognitif à partir du moment où il annonce qu'il rêve depuis les 400 dernières pages (Aragon, La Semaine sainte).

En résumé, Fontanille en arrive à proposer une représentation du discours, du moins à partir de sa dimension cognitive, comme une succession de points de vue séparés par des solutions de continuité, où se constituent des " précipités " interactifs. Et ces considérations sont reprises en d'autres termes par Brown et Yule (1984, 114) et par Vignaux (1988, 35).

2.8 La notion de sujet dans le champ spécifique des sciences de l'information/Birger Hjorland

Cette mobilité des actants lors de la détermination du sujet d'une oeuvre de création, clairement démontrée par Fontanille, Hjorland (1992) l'a envisagée en regard des sciences de l'information. Appuyant ses réflexions sur certains courants philosophiques, il remet en perspective les accents de certaines tendances mises tantôt sur l'auteur, tantôt sur le lecteur lors de la représentation des connaissances contenues dans les documents. Aucune d'entre elles n'est évidemment parvenue à suffir à l'entière détermination du sujet.

La notion de sujet que propose Hjorland est donc dite " matérialiste ", c'est-à-dire qu'elle s'appuie sur les propriétés susceptibles d'optimiser les " perceptions potentielles " (" potential perceptions ") ; Eco dirait les mondes possibles du document. Pour laisser émerger ces possibilités, ces extensions futures du sujet, il va de soi que l'on ne quantifie plus les propriétés d'un texte, puisqu'il est impossible, à un moment donné, de prévoir lesquelles seront ultérieurement utiles pour un lecteur particulier. De la même façon, une propriété considérée valable dans un contexte donné peut se révéler inopérante dans un autre. C'est dire qu'aucune propriété d'un document ne peut être considérée comme éternelle ou prédominante.

Ces affirmations remettent en question moult systèmes de classification fondés sur certains a priori en vigueur jusqu'ici, du système à facettes de Ranganathan aux thésaurus traditionnels, en passant évidemment par les vedette-matières.

CONCLUSION

La notion d'aboutness ou de topic baigne dans un univers théorique vaporeux, imprécis. Soit. Mais cette imprécision réflète un changement majeur dans les champs d'études qui touchent la classification et la détermination du sujet d'un document. La plupart des auteurs veulent que l'analyse de textes en langage naturel tienne compte de la subjectivité des actants qui les manipulent. On peut affirmer qu'il s'ensuit, en sciences de l'information, un déplacement de l'indexation axée sur le contenu vers une indexation basée sur les besoins de l'utilisateur (Soezgel 1985, cité par Hjorland 1992, 179).

Bien que l'on admette que l'interprétation se doive d'être rappelée à l'ordre par le texte, qu'elle doive se soumettre à une validation répétée au fil de la lecture, comme le souligne Eco, les mondes possibles sur lesquels ouvre le texte demeurent trop nombreux pour que l'on puisse espérer déterminer par quelque mode d'analyse que ce soit LE topic d'un texte. Citons Hjorland à ce propos :

(...) the objective-idealistic point of view does not - as did the subjective-idealistic viewpoint - match the concept of subject in the minds of some people. Instead it presumes that some kind of abstract analysis of fixed procedure could be used to penetrate the surface of documents, thereby revealing true subjects. (...) no such procedure can garantee a correct subject analysis. (Hjorland 1992, 179)

Qui ne s'est pas demandé en lisant un livre abondamment souligné, emprunté à la bibliothèque, pourquoi diable avait-on souligné tel ou tel passage, incongru dans notre cheminement interprétatif ? De la même façon que son origine culturelle, ou le contexte dans lequel il se trouve, ce que cherche le lecteur dans un texte conditionne son interprétation (Brown et Yule 1984, 145). Farrow (1991) a par exemple démontré qu'un indexeur ne prend pas connaissance d'un texte dans les mêmes " conditions " qu'un autre lecteur.

Un système informatique d'aide à l'analyse devrait donc non pas être conçu en fonction du texte, mais en fonction du texte et de l'émetteur et du récepteur, voire des couches successives de récepteurs qui ont interprété le texte.

La détermination de la thema ou de qui est posé par le texte, comme le laissent entendre la plupart des auteurs ci-haut cités, pourra s'effectuer en autant que les grilles d'analyse puissent être interchangeables au gré des lecteurs et de ce que chacun sollicite dans un texte.

La thématique, analysée ici sous l'angle de la sémantique textuelle, en arrive à subir le même traitement que toutes les autres données contenues dans un texte (typographiques, orthographiques, morphologiques, lexicales, etc.) ; au lieu d'être perçue comme une donnée enfouie à faire émerger, elle est vue comme le lieu d'indicateurs potentiels, utilisables dans un processus de sélection interprétative à la carte.

Il serait très intéressant, à cet effet, de mettre en rapport les analyses sémantiques du discours textuel avec celles auxquelles ont donné lieu l'histoire de l'art. Pensons par exemple à l'analyse des manuels d'histoire de l'art qu'a fait Carol Doyon :

De prime abord, le manuel semble neutre : il se donne moins comme la reconstruction d'une histoire que comme un dictionnaire, une encyclopédie ou un thésaurus ; son objectivité n'est pourtant qu'apparente car son principe d'organisation est déterminant. Il ne ferait pas que véhiculer de l'information. Au contraire, son contenu codé et construit impose une structure de la discipline et un ordre dans l'acquisition du contenu. (Doyon 1991, 17)

Brown et Yule ont également remarqué que si l'analyse d'un matériau non inguistique comme la photographie ne révèle pas avec évidence de propositions signifiantes déterminées, peut-être cette façon d'extraire le sens n'est-elle pas davantage appropriée pour le texte (Brown et Yule 1984, 113). De la même façon, Rastier ouvre une piste en disant :

Comme les arts graphiques révèlent des lois de la perception visuelle quand ils mettent à profit les illusions optiques, les arts du langage exploitent les illusions sémantiques (en premier lieu les images mentales qui déterminent l'impression référentielle). Par là ils révèlent des lois de la perception du sens. C'est pourquoi l'esthétique pourrait ouvrir à la recherche cognitive un domaine de recherches d'une richesse encore inaperçue. (Rastier 1989, 9)

Chacune des propositions que font les auteurs examinés ci-haut en vue de déterminer le topic d'un texte est en soi pertinente, dépendant de la voie interprétative sur laquelle le lecteur s'engage. Critiquer l'idée des macro-structures de van Dijk en les considérant comme trop rivées sur le format du texte, ou questionner la structure hiérarchique générique-spécifique mise de l'avant par Rastier ou Eco démontre une chose : l'impossibilité d'envisager l'analyse textuelle comme un instrument "unique", le texte n'obéissant pas à une logique monothéiste, dirions-nous. La refonte de toutes les "versions" théoriques du topic ou de la thématique est donc impossible et non pertinente, chacune d'elles devant plutôt être considérée comme interchangeable.

Ces considérations ont déjà donné lieu à des développements en indexation. Pensons seulement à l'évaluation de la faisabilité de logiciels informatiques permettant la juxtaposition de différentes grilles d'analyse textuelle, à partir de textes respectant la norme SGML par exemple (Text Encoding Initiative, entre autres).

De telles réalisations permettent non seulement au pigeon de Perec de picorer à son gré, mais aussi, grâce à l'enregistrement de ses déplacements, à l'éclatement de sa pratique de pigeon-voyageur, de circuler confortablement dans des paysages jusque-là trop accidentés pour permettre le moindre vol plané...


BIBLIOGRAPHIE

Brown, Gillian ; Yule, George. Discourse Analysis. 2e éd. Cambridge : Cambridge University Press (Cambridge Textbooks in Linguistics), 1984, (1983 ©).

Dijk, Teun A. van. " Perspective Paper : Complex Semantic Information Processing. " In Walker, D.E., H. Karlgren et M. Kay. Natural Language in Information Science :Perspectives and Directions for Research. Stockholm : Skriptor, 1977 : 127-163.

Doyon, Carol. Les Histoires générales de l'art : Quelle histoire ! Collection Vedute, Laval : Éditions Trois, 1991, 251 p.

Eco, Umberto. " Notes sur la sémiotique de la réception ". Actes sémiotiques - Documents 9, no 81 (1987).

Eco, Umberto. The Limits of Interpretation. Indianapolis : Indiana University Press, 1990 (1984 ©).

Eco, Umberto. Lector In Fabula. Paris : Le Livre de poche (biblio essais) ; 1985 (1979 ©).

Farrow, John A. " A Cognitive Process Model of Document Indexing. " Journal of Documentation 47, no 2 (juin 1991) : 149-166.

Fontanille, Jacques. " Point de vue : essai de définition discursive. " Protée 16, no 1-2 (hiver-printemps 1988) : 7-22.

Hjorland, Birger. " The Concept of 'Subject' in Information Science. " Journal of Documentation 48, no 2 (juin 1992) : 172-200.

Hutchins, W.J. "The Concept of 'Aboutness' in Subject Indexing. " ASLIB Proceedings 30, no 5 (mai 1978) : 172-181.

Kristeva, Julia. Recherche pour une sémanalyse. Paris : Seuil, 1969.

Maron, M.E. " On Indexing, Retrieval and the Meaning of About. " Journal of American Society for Information Science 28, no 1 (janvier 1977) : 38-43.

Perec, Georges. Penser/Classer. Textes du XXe siècle, Paris : Hachette, 1985.

Rastier, François. Sens et textualité. Paris : Hachette, 1989.

Vignaux, Georges ; Khadiyatoulah, Fall. " Genèse et construction des représentations : les discours sur l'informatisation. " Protée 18, no 2(printemps 1990) : 33-44.

Vignaux, Georges. Le Discours acteur du monde : énonciation, argumentation et cognition. [Paris] :Ophrys, 1988.