L'hypertexte: historique et applications en bibliothéconomie

par

Guy Teasdale


Cursus vol.1 no 1 (octobre 1995)


Cursus est le périodique électronique étudiant de l'École de bibliothéconomie et des sciences de l'information (EBSI) de l'Université de Montréal. Ce nouveau périodique diffuse des textes produits dans le cadre des cours de l'EBSI.

ISSN 1201-7302

cursus@ere.umontreal.ca
URL: http://www.fas.umontreal.ca/ebsi/cursus/

L'auteur

Guy Teasdale travaille à l'Université Laval depuis 1976. Il est devenu technicien en documentation en 1980. Depuis, il a été responsable du Centre de documentation du Centre international de recherches sur le bilinguisme, employé à la cinémathèque puis à la section de référence de la bibliothèque générale. Il s'intéresse à l'informatique documentaire depuis 1984 et a participé activement à l'informatisation de la bibliothèque de l'Université Laval. Bachelier en science politique, il a entrepris, à l'automne 1994, des études de maîtrise en bibliothéconomie et en sciences de l'information, à l'Université de Montréal. Ses intérêts de recherche actuels portent sur l'Internet et le SGML.

L’hypertexte: historique et applications en bibliothéconomie a été écrit à l’hiver 1995 dans le cadre du cours Technologies de l’information (BLT 6029) donné par le professeur James Turner.

Pour joindre l'auteur: teasdalg@ere.umontreal.ca

Droits d'auteur

Tout texte demeure la propriété de son auteur. La reproduction de ce texte est permise pour une utilisation individuelle. Tout usage commercial nécessite une permission écrite de l'auteur.



TABLE DES MATIÈRES

INTRODUCTION

1. DÉFINITION DU TEXTE

2. DÉFINITIONS DE L’HYPERTEXTE ET DES HYPERMÉDIAS

3. TYPOLOGIE DE L’HYPERTEXTE
3.1 Microtexte
3.2 Macrotexte
3.3 Hypertexte de travail en collaboration
3.4 "Expert text"

4. QUELQUES PROBLÈMES RELIÉS À L’HYPERTEXTE
4.1 Stockage
4.2 Vitesse
4.3 Écran vs papier
4.4 Désorientation cognitive

5. HISTOIRE DE L’HYPERTEXTE
5.1 Vannevar Bush
5.2 Paul Otlet
5.3 H. G. Wells
5.4 Douglas C. Engelbart
5.5 Theodor Holm Nelson
5.6 Bill Atkinson
5.7 Tim Berners-Lee et le World Wide Web

6. SGML ET HTML

7. APPLICATIONS BIBLIOTHÉCONOMIQUES
7.1 Format MARC - champ 856
7.2 Bibliothèque virtuelle
7.3 La norme Z39.50
7.4 Le catalogage

CONCLUSION: DES DÉFIS PASSIONNANTS (ET DONC QUELQUES OBSTACLES...)

BIBLIOGRAPHIE


INTRODUCTION

L'objet de cet article est de présenter l'histoire de l'hypertexte, d'évaluer sa place, sa pertinence et son importance de plus en plus grande dans les sciences de l'information, particulièrement à la lumière du succès phénoménal du World Wide Web.

Si l'on se rapporte au dictionnaire, on voit que la bibliothéconomie est la "science qui définit les règles d'organisation et de gestion des bibliothèques". On voit également que la bibliothèque est une "salle, édifice où sont classés des livres pouvant être consultés" (Rey-Debove et Rey, 1995, 217). L'objet de la bibliothéconomie semble donc encore loin de l'hypertexte. Et bien, ces definitions devront être actualisées puisque, depuis Paul Otlet (1868-1944), c'est le document qui nous préoccupe et non plus seulement le livre. Or qu'est-ce qu'un document? C'est un objet porteur d'information accessible directement sur un médium fixé (Estivals 1987).

L'histoire des bibliothèques est liée à l'histoire du texte fixé sur un support quelconque. Elle est donc également liée à l'évolution de ces supports: ardoise, os, cuir, métaux, tablettes d'argile et de cire, rouleaux de papyrus, codex de parchemins, livres. Le document hypertexte est rendu possible par la dernière technologie servant de support au texte: l'informatique. Ce dernier support du texte est toutefois différent de tous les autres: il entraîne une (r)évolution du concept de bibliothèque. En effet, par définition la bibliothèque est un espace clos. L'élément "thèque" du mot bibliothèque vient du grec thêkê "loge, réceptacle, armoire". L'hypertexte ouvre cet espace, fait tomber les murs, permet d'envisager une bibliothèque virtuelle à l'échelle du globe. Virtuelle parce qu'immatérielle. Pour la première fois dans l'histoire de l'écrit, l'information se transmet de façon immatérielle, les signes informatiques étant une suite de 0 et de 1 qui ne sont pas directement accessibles à l'humain mais doivent transiter par un médium informatique (Balpe 1990).

Il importe pour la profession de se pencher sur cette question car, comme le souligne Yannick Maignien, "[...] la révolution numérique actuelle n'a de référent comparable que le passage du manuscrit à l'imprimé au XVe siècle, à l'imprimé comme nouveau moyen de stockage, d'organisation et de circulation des savoirs" (Maignien 1995, 9). L'hypertexte représente une nouvelle façon d'appréhender le savoir, une nouvelle façon de structurer l'information. Il permet de créer des liens que le livre ne permettait pas, de se libérer de l'organisation disciplinaire et morcelée issue de la production livresque. Pour Maignien toujours, "la fécondité des connaissances est plus attendue dans les limites, les marges, transdisciplinarités, multidisciplinarités, hybridations, métissages et autres rapprochements inattendus..." (Maignien 1995, 11). Permettant ce genre de nouvelle structuration, l'hypertexte est issu d'une confrontation féconde entre de nombreuses disciplines (dont la bibliothéconomie). Enfin pour la profession, "l'hypertexte en réseau [...] est un défi intellectuel qui doit nous mobiliser passionnément, qui permettra de repenser la bibliothèque mais aussi qui doit hériter du savoir-faire et des réflexions multi-séculaires des bibliothécaires" (Le Crosnier 1995, 24).

Nous verrons que l'hypertexte n'est pas un concept nouveau surgi de nulle part aux alentours de 1989! Pour plusieurs auteurs, l'hypertexte est né il y a maintenant 50 ans avec la parution d'un article de Vannevar Bush intitulé As we may think . En réalité, l'origine du concept est encore plus ancienne. Nous présenterons assez longuement l'histoire de cette technologie car nous croyons que l'hypertexte est d'une importance capitale dans l'histoire et l'avenir des sciences de l'information. Nous croyons que la bibliothéconomie a beaucoup à apporter et a déjà beaucoup apporté à ce champ de recherche et ce, depuis plus de 50 ans! Il est donc important de connaître l'apport de la bibliothéconomie, de s'approprier l'histoire de notre profession, pour continuer à prendre la place qui nous revient dans l'évolution de l'hypertexte.

Nous verrons que l'hypertexte c'est encore du texte même s'il est sur un support "luminescent et fugitif". C'est toutefois de l'Hyper texte c'est à dire du texte à "n" dimensions. Nous essaierons de saisir quelles sont ces dimensions supplémentaires. Nous commencerons par une définition des principaux termes. Ensuite, nous tenterons d'établir une typologie de l'hypertexte, nous survolerons sa (longue) histoire et, enfin, nous verrons quelques applications bibliothéconomiques et quelques perspectives d'avenir.

1. DÉFINITION DU TEXTE

Afin de comprendre l'hypertexte, il est nécessaire de s'arrêter un instant pour réfléchir au concept de "texte". Le Robert définit le texte comme étant "la suite des mots, des phrases qui constituent un écrit ou une oeuvre". Il est intéressant de constater que texte, de par son origine latine, est associé au tissu, à la trame, au fait de tisser car cela nous permet d'établir un parallèle avec l'application la plus spectaculaire de l'hypertexte, le World Wide Web, associée également à la toile (le Web). Pour Roy Rada, (Rada 1991, 1) le texte est de l'information enregistrée, il est est synonyme de document (qui peut aussi contenir du graphique) et il est lisible directement par l'humain. C'est un médium pour la transmission de la culture et de la science.

L'évolution de la technologie liée au texte fut très lente: les premiers écrits remontent à 6000 ans avec les Sumériens alors que l'invention de la presse à imprimer ne remonte qu'à 1434 soit moins de 600 ans.

L'histoire nous apprend aussi que les technologies liées au texte sont adoptées graduellement. Ainsi, par exemple, pendant le premier siècle de l'imprimerie, on retouchait les textes imprimés pour leur donner un aspect "manuscrit". D'autre part, en plus des réticences culturelles, les investissements économiques nécessaires pour passer aux nouvelles technologies constituent souvent un frein à l'acceptation des innovations. Notons toutefois, quelques accélérations de l'histoire: si les machines à écrire mécaniques ont duré un siècle, les machines à écrire électriques auront duré beaucoup moins longtemps: elles ont été remplacées par les ordinateurs en moins de dix ans.

Nous verrons plus loin que les technologies liées à l'hypertexte ne sont pas adoptées rapidement non plus. Le succès phénoménal du WWW depuis deux ans ne doit pas faire illusion: l'hypertexte est un concept envisagé depuis très longtemps mais qui n'est réalisable techniquement que depuis peu de temps et ne sera adopté à grande échelle que lorsque l'infrastructure technologique sera tout à fait au point et lorsqu'on se sera détaché de notre structure mentale "livresque" pour mieux percevoir toutes les possibilités de structuration des connaissances apportées par l'hypertexte. L'excellent article de Yannick Maignien (1995) fait bien le point sur ce sujet.

A première vue, le texte est conçu pour être lu de façon linéaire, séquentielle. Les idées sont découpées suivant une structure logique que des siècles de tradition imprimée ont plus ou moins hiérarchisée: paragraphes, pages, chapitres.

La réalité est plus complexe. En effet, le texte est une réalité tangible, découpée en éléments qui brisent la linéarité; par exemple, la typographie peut introduire des valeurs de force (gras, souligné), d'imbrication (chapitre, paragraphe, note). De plus, des outils comme les index ou les tables des matières permettent de retrouver l'information rapidement et de faire une lecture non linéaire. Tous ces éléments physiques du texte, couplés aux acquis de la tradition imprimée font qu'un texte a plus d'une dimension.

2. DÉFINITIONS DE L’HYPERTEXTE ET DES HYPERMÉDIAS

Dans une structure hypertextuelle, les idées (noeuds d'information) sont également reliées (notion de liens) logiquement mais cette fois, d'une façon non linéaire. Cette définition est toutefois trop large car une note de bas de page dans un texte pourrait correspondre alors à de l'hypertexte. Une encyclopédie, une collection seraient des hypertextes par les séries de renvois qu'elles proposent.

Essayons d'aller plus loin. Ted Nelson, l'inventeur du terme, définit simplement l'hypertexte comme de l'écriture/lecture non séquentielle ou encore comme une "text structure that cannot be conveniently printed" (cité par Nyce 1991, 253). Pour Jeff Conklin (cité par Ramaiah 1992), l'hypertexte est du "text in electronic form that takes advantage of the interactive capabilities". Il faut donc ajouter la composante informatique à notre définition. Les liens entre les parties du texte sont gérés par ordinateur et permettent d'accéder à l'information d'une manière plus semblable à notre façon de penser (associative) ou, tout au moins, d'une façon personnalisée (chacun active les liens qu'il veut dans l'ordre qu'il choisit).

La définition n'est toutefois pas encore complète. En effet, on peut également lire un livre de façon personnalisée en se servant des outils ou repaires visuels du livre mentionnés plus haut. De plus, un simple fichier inversé, que l'on retrouve couramment dans les systèmes de gestion de bases de données textuelles (SGBD), permet d'accéder à tous les mots d'un texte. On peut y greffer un thésaurus qui effectuera des liens automatiques entre un mot ou son synonyme pour accéder à l'information. Les SGBD textuelles seraient donc des hypertextes? Non car ce type de recherche s'effectue uniquement sur une chaîne alphanumérique. C'est donc une recherche basée sur la syntaxe alors que les liens hypertextuels sont d'ordre sémantique. Ce sont des liens du genre: problème-solution, tout-partie, cause-effet, lien chronologique, etc.

Il y a, on le voit, une multitude de définitions. La moins conventionnelle est la suivante: "Hypertext is like pornography--everyone feels they know it when they see it, but nobody can pen a succinct summary to which all parties agree" (Borgman et Hentsell 1989; cité par Olszewski 1990, 105). Une autre définition va à l'essentiel: "However defined, the point is this: electronic links are created between pieces of information in a machine-readable document and a computer is used to make quick leaps between those pieces of linked informations. A computer is required to define those links in the course of creating a hypertext document, and a computer is required to execute those links during the course of reading or using that document" (Kinnell 1992, 279).

Les dimensions multiples de l'hypertexte peuvent être décrites par une étude de sa structure interne, de ses relations avec d'autres hypertextes, de sa dimension de communication dans les hypertextes de groupe où plusieurs personnes peuvent modifier un même texte. Balpe (1990) signale aussi plusieurs caractéristiques particulières aux hypertextes qui ajoutent des dimensions spécifiques à ce type de document. Le caractère immatériel des signes sur support informatique. Leur mobilité: il suffit par exemple d'ajouter un codage "italique" pour modifier instantanément l'apparence des signes. Leur générativité: du texte nouveau peut être généré en temps réel. Par exemple, en visitant une page WWW on pourrait programmer un affichage automatique du temps et de l'heure. La phrase: "Bonjour, nous sommes le 27 juillet 1995 et il est 22:35 heures" pourrait n'avoir jamais existé et être générée automatiquement. Leur instantanéité: l'ordinateur peut faire apparaître du texte en temps réel. Le bouquinage d'un livre qui prend un certain temps sur papier est instantané avec l'hypertexte. Leur interactivité: le lecteur choisit ses parcours de lecture et certains parcours peuvent enclencher tel ou tel processus de l'ordinateur. Enfin leur délocalisation: contrairement au papier, plus besoin d'être au même endroit pour consulter un hypertexte et même pour le créer.

Parmi les avantages de l'hypertexte, il y a la possibilité de naviguer rapidement parmi une masse importante d'information, qu'on peut consulter à des niveaux de détails plus ou moins grands. L'hypertexte permet également des économies d'espace en évitant d'avoir à dupliquer des données. En effet, si on peut créer un hyperlien vers ces données, le tour est joué. Cette technologie peut également favoriser la collaboration des usagers en vue de la mise à jour rapide de données. Endin, la possibilité d'ajouter des commentaires à des textes favorise l'esprit critique.

Ayant posé ces prémisses, nous pouvons maintenant affirmer que l'hypertexte n'est pas "comme une encyclopédie". "Non seulement de telles analogies, ignorant résolument les spécificités de l'information traitée par l'ordinateur, sont fausses, mais, qui plus est, elles sont dangereuses: elles figent la réflexion, interdisant, au nom d'un certain conservatisme de conception, de voir ce qu'il y a de fondamentalement nouveau dans le statut des hyperdocuments et qui, pour l'essentiel, tient à la nature même et aux particularités de l'information traitée par instrument informatique" (Balpe 1990, 7).

Si on ajoute des graphiques, du son, des séquences d'animation, on ne parle plus d'hypertexte mais d'hypermédia. La terminologie n'est pas encore tout à fait fixée; on entend souvent le terme multimédia alors que certains utilisent le syntagme multimédia interactif. Multimédia s'applique à tout processus qui peut gérer du texte, des images, du son, des graphiques animés. À ce titre, la télévision et le vidéo des produits multimédias. Mais ils sont linéaires, l'usager ne peut que regarder, écouter, il ne peut agir sur l'information. Le Compact Disk-Interactive (CD-I) et le Digital Video Interactive (DVI) permettent toutefois une interaction en reliant des blocs d'information au moyen de technologies hypertextuelles. On peut donc dire que tous les produits hypermédias sont multimédias mais non l'inverse.

Alors, l'hypertexte? c'est un concept? un logiciel, une technologie? un système? un "univers de documents"? (ou "docuverse" d'après Ted Nelson). C'est en fait un peu tout ça. On peut parler d'un hypertexte en parlant du document codé en hypertexte. Il ne faut pas confondre un produit hypertexte avec un logiciel hypertexte qui permet de produire ou de lire des hypertextes. On peut également voir l'hypertexte comme un mécanisme d'accès à l'information et une façon de penser la structuration de cette information (McKnight et al 1992, 251).

3. TYPOLOGIE DE L’HYPERTEXTE

Il est possible de classer les systèmes hypertextes selon différentes catégories: les systèmes distribués, multi-usagers et les systèmes basés sur des ordinateurs personnels. On peut également les classer selon leur génération; les premiers systèmes (avant 1980) étant, par exemple, tous basés sur ordinateur central et utilisant surtout des noeuds textuels avec peu ou pas de graphiques. Vinrent ensuite les stations de travail puis les micro-ordinateurs. On peut également les aborder sous l'angle de leur utilisation: il peut s'agir d'outils de travail de groupe, de didacticiels, d'outils de résolutions de problèmes. L'utilisation la plus fréquente de l'hypertexte est toutefois l'exploration de texte. Il existe donc différentes catégories d'hypertextes et Rada (1991) présente d'une façon très détaillée les distinctions suivantes:

3.1 Microtexte

Un microtexte est un texte avec des liens explicites entre ses différentes parties. Il fonctionne en mode autonome (stand alone) et permet généralement de manipuler les liens, d'éditer le texte et de le parcourir. La fonction d'aide dans Windows ou encore le logiciel HyperCard sont de bons exemples de microtextes.

3.2 Macrotexte

Un macrotexte c'est de l'hypertexte avec des liens vers plusieurs documents. Le macrotexte est utilisé pour chercher de l'information dans une collection de documents alors que le microtexte sert à naviguer à travers un document. Notons qu'un système macrotexte n'est pas nécessairement en réseau. Il peut tenir sur un support comme le CD-ROM.

3.3 Hypertexte de travail en collaboration

Ce type d'hypertexte concerne un texte qui est créé ou consulté par plusieurs personnes en même temps. Il permet également de voir l'évolution d'un projet, peut être utilisé dans le cadre de cours, comme aide à l'écriture ou comme outil de résolution de problèmes dans lequel chaque usager peut apporter sa position, ses arguments pour ou contre telle idée. Les liens entre les groupes de textes permettent, par exemple, d'accéder aux versions des différents textes, aux discussions entre les auteurs, aux annotations, bref, de voir la genèse du document. Chaque noeud ou bloc de texte possède des attributs qui servent à garder la trace de qui a fait la modification et quand il l'a faite.

3.4 "Expert text"

Ce type d'hypertexte permet, en plus des liens entre les textes, de déclencher des réponses différentes suivant que certains liens sont traversés. On combine ainsi la technologie des systèmes experts avec l'hypertexte. Il suffit d'imbriquer des procédures dans certains liens. Par exemple, si tel lien est activé, le concepteur du système présume que le lecteur est un novice et prévoit une procédure qui présentera un type particulier d'information. Cette possibilité existe dans des systèmes comme HyperCard et même avec le WWW par l'intermédiaire des CGI (Common Gateway Interface). Le HTML (Hyper Text Markup Language) permet de créer des systèmes experts élémentaires dans les bibliothèques. On peut voir l'exemple du système développé à la bibliothèque de l'Université Yale dans un court article de David Stern (Stern 1995).

4. QUELQUES PROBLÈMES RELIÉS À L’HYPERTEXTE

4.1 Stockage

Jusqu'à tout récemment un des problèmes reliés à l'hypertexte était le stockage. Ce problème était particulièrement évident pour les hypermédias car les images et les sons numérisés occupent beaucoup d'espace. Maintenant, avec les réseaux, le traitement distribué et les possibilités de stockage de masse comme les CD-ROM, les vidéodisques, les problèmes sont partiellement résolus. De plus en plus, pour les hypertextes en réseau, nous retrouvons une architecture client-serveur, où on répartit mieux la charge de travail entre le serveur hypertexte et le client hypertexte. D'autres gains importants ont été réalisés au niveau des algorithmes de compression de données de plus en plus performants.

4.2 Vitesse

Il reste tout de même le problème de la vitesse d'accès à des documents à distance: l'infrastructure de télécommunications n'est tout simplement pas prête à distribuer des documents comme des vidéos ou des images en mouvement. Le temps d'attente est trop long. Il faut avoir cherché à visualiser un clip vidéo pour réaliser que les liens entre certains points de l'Internet sont encore beaucoup trop lents. Certaines villes, Chicoutimi par exemple, sont reliées à 56 kbs à l'Internet (source: Plan du réseau interordinateurs scientifique québécois (RISQ), 24 octobre 1994) alors que des modems personnels de 28kbs peuvent être achetés pour 300$!!! Le Canada vient de décider de se câbler en T-1 (technologie qui permet de faire circuler 1,544,000 bits par seconde) alors que les États Unis passent au T-3 (45,000,000 bits par seconde) (source: notes de cours - Marcos Silva, Télématique et Réseaux, H-95). Une image en mouvement sur toute la surface de l'écran demande une vitesse d'au moins 10 mégabits à la seconde! On voit qu'il reste du travail à faire et que votre club vidéo a encore quelques années de répit avant que ces problèmes de vitesse d'accès soient résolus.

4.3 Écran vs papier

Au début de la micro-informatique, des études démontraient que la lecture de texte était jusqu'à 30% moins rapide à l'écran que sur papier. Il semble que ce problème se résorbe avec l'amélioration de la qualité des écrans (Rada 1991, 13).

4.4 Désorientation cognitive

Une autre limite importante de l'hypertexte c'est qu'il n'y a pas encore de "grammaire" qui permette de saisir d'un seul coup d'oeil les différentes formes de continuités et d'enchaînements qu'un lien nous apportera si on l'active. Si on active, par exemple, un lien sur un mot, est-ce qu'on aboutira à une définition de trois lignes ou à une thèse de doctorat portant sur ce thème? Le lien ne nous le précise pas. Ceci amène deux types de désorientation cognitive: le problème du "musée d'art" où on voit tellement d'informations et d'images qu'on ne sait plus ce qui est relié et on ne retient rien. La richesse de la représentation non linéaire hypertextuelle porte en elle le risque d'une "indigestion intellectuelle". Le Crosnier nomme le deuxième type de désorientation, les "digressions imbriquées" où on perd de vue le but de sa recherche en suivant les chemins de traverses offerts par l'hypertexte (Le Crosnier 1995, 24; Jonassen 1989, 45).

Les liens sont tellement faciles à créer et la théorie à ce sujet tellement nouvelle qu'il y a risque de créer trop de ces liens, créant par le fait même un effet de vidéoclip. Il reste à développer une "stylistique" du design hypertexte si on ne veut pas aboutir à un "Hyper-Chaos".

Des recherches en cours pour résoudre ces problèmes utilisent les ressources de plusieurs sciences (psychologie cognitive, linguistique, ergonomie, etc.). On peut constater la multidisciplinarité en lisant l'appel de participation lancé par l'ACM (Association for Computing Machinery) pour son prochain congrès portant sur l'hypertexte. "Hypertext '95 will provide a common setting for researchers and practicing professionals to share experiences and to compare notes about their interests in hypermedia authoring, publishing, system construction, human- computer interaction, digital libraries, and electronic literature. Attendees come with backgrounds in computing, psychology, literature, sociology, engineering, law, medicine... many different fields."

5. HISTOIRE DE L’HYPERTEXTE

L'auteur le plus cité dans l'histoire de l'hypertexte, c'est Bush et son "As we may think" . Autant commencer par lui, même s'il n'est pas le seul "père fondateur".

5.1 Vannevar Bush

En juillet 1945, il y a 50 ans cette année, paraît un texte intitulé "As we may think". Ce texte, qui est devenu un classique, présente une vision de l'avenir technologique. L'auteur, Vannevar Bush, était alors directeur du bureau de la recherche scientifique et du développement qui avait coordonné les activités de plus de 6000 scientifiques américains pendant la Seconde Guerre mondiale. Il jouissait d'un prestige considérable.

Dans son introduction, il présentait les apports de la science à l'humanité. Après avoir servi à augmenter la puissance physique de l'homme, à améliorer son contrôle sur l'environnement et sur son corps, la science devait maintenant s'attarder à augmenter la puissance de son esprit en développant des outils qui lui permettraient d'améliorer sa connaissance des découvertes du passé.

Un des problèmes soulevés par Bush était celui de l'explosion documentaire. Il voulait éviter que des découvertes scientifiques soient perdues dans la masse documentaire et citait le cas des découvertes de Mendell sur la génétique qui avaient été ignorées pendant toute une génération parce que sa publication n'avait pas rejoint les bonnes personnes. Selon Bush, un document, pour être utile à la science, doit être complété, enrichi et augmenté. Il doit être rangé et surtout il doit être consultable.

Bush décrivait une machine qui pourrait rencontrer ses objectifs. Cette "machine à penser", il l'appellait MEMEX (MEmory EXtender), avait les caractéristiques suivantes:

  1. Une immense collection de documents sur microfilm;

  2. La possibilité de les projeter sur écran, à grande vitesse et au besoin;

  3. La possibilité d'ajouter des images aux microfilms;

  4. La possibilité de localiser les enregistrements au moyen d'un codage et d'un système de cellules photo-électriques;

  5. et surtout, des "pistes associatives". C'est précisément cette notion qui en fait le père de l'hypertexte (pour la majorité des auteurs). Bush envisageait de pouvoir associer des microfilms entre eux pour mieux simuler le cheminement de la pensée au moyen d'un ingénieux système utilisant des cellules photo-électriques.

Bush avait en piètre estime les systèmes existants d'indexation et de classification hiérarchique. "Professionally our methods of transmitting and reviewing the results of research are generations old and by now are totally inadequate" (Bush 1945, 101) ou encore: "Our ineptitude in getting at the record is largely caused by the artificiality of systems of indexing ... one has to have rules as to which path will locate it and the rules are cumbersome" (Bush 1945, 106).

Avec tous les développements rendus possibles par l'informatique, l'hypertexte est maintenant une réalité tangible. En lisant son texte, on peut penser, à posteriori, que Bush était un visionnaire et on peut voir ce texte comme un phare culturel ayant inspiré les générations subséquentes. Cependant, en le situant dans le contexte scientifique de son époque, on découvre que la réalité est un peu différente. D'après Buckland, l'article de Bush "has become a fashionable icon of modern information science, typically used as a convenient point of departure, or as an invocation of respectability" (Buckland 1992, 284). Buckland démontre également dans ce texte que des spécialistes de l'information de l'époque, Otlet, bibliographe belge et Schürmeyer, bibliothécaire allemand, étaient, 10 ans avant, tout aussi visionnaires que Bush. Ils n'avaient toutefois pas le prestige de Bush au sortir de la Seconde Guerre mondiale, ni le prestige des sciences "dures".

"As we may think" a été écrit en 1939 alors que Bush travaillait sur un sélecteur de microfilm rapide à cellules photo-électriques. La technologie qu'il utilisait était entièrement analogique; c'était avant l'arrivée de l'informatique. Buckland nous apprend que cette technologie de recherche documentaire avait d'abord été mise de l'avant par Emanuel Goldberg dans les années 1920. Les travaux de ce savant juif, qui fut à l'origine également de la notation de la vitesse des films en Din ou ASA, furent occultés par les Allemands pendant la guerre et tombèrent dans l'oubli par la suite.

D'autre part, l'idée d'une collection de documents sur microfilm datait de 1853 et participait déjà d'une longue tradition documentaire en 1939. En effet, c'est en 1912 qu'on a utilisé pour la première fois le microfilm à des fins de stockage de l'information sous forme réduite (Chaumier 1971, 6); rien de bien nouveau également de ce côté. Enfin, en ce qui concerne les "pistes associatives" qui, selon Bush, étaient plus apparentées à la façon de penser humaine (par association d'idées), elles équivalent en fait à une indexation. Dans l'exemple donné par Bush, les "liens de pertinence" dans sa piste associative sont en réalité des termes d'indexation. Toutefois, le fait de lier des documents en se basant non pas sur leur contenu mais sur leur degré de rapport (relevance) entre eux, est erroné. Bush basait ainsi tout son système sur un jugement susceptible d'évoluer à mesure que les connaissances de l'individu évoluaient. De plus, des jugements de pertinence peuvent parfaitement correspondre à un individu et sembleront non pertinents à un autre. Ce système hypertexte proposé par Bush était donc très "personnel" et risquait peu de solutionner les problèmes d'accès à l'information qu'il dénonçait.

Dans un autre article, Colin Burke, un historien, rend compte des tentatives avortées de Bush pour créer deux machines ressemblant au MEMEX: le Rapid Selector et le Comparator. Des prototypes ont bien été construits mais avec peu de succès sauf peut-être une utilisation par les services secrets pour du décryptage. Une série d'erreurs administratives et techniques ont été commises. Burke mentionne entre autres que les connaissances limitées de Bush en indexation rendaient pratiquement impossible la réalisation de la machine envisagée dans "As we may think". De fait, MEMEX n'a jamais été réalisé. Toutefois, Bush conserve le mérite d'avoir fait rêver des générations de chercheurs en indiquant une route à suivre. La technologie analogique qu'il utilisait allait rapidement tomber en désuétude au début des années 1960 avec l'arrivée des ordinateurs digitaux modernes et l'enregistrement magnétique des données (Burke 1992, 655).

5.2 Paul Otlet

Même si Bush demeure un géant de la technologie et du génie américain, il semble qu'il soit nettement exagéré de lui conférer le titre de "Father of Information Science" (Liller & Rice 1989, cités par Buckland 1992, 284). Par contre, Rayward (1994) mentionne que le Belge Paul Otlet, pourrait avoir eu une "vision de Xanadu" plusieurs années avant tout le monde. Tout comme pour Bush, la "technologie habilitante" (enabling technology) n'existait pas encore mais néanmoins les réalisation d'Otlet sont impressionnantes compte tenu des moyens de l'époque. Examinons donc un peu plus en détail qui était Paul Otlet et son rapport avec l'hypertexte.

Les travaux d'Otlet marquent les débuts de l'histoire de la documentation et de ses techniques. Alors que l'on conservait l'information depuis l'Antiquité, on commença, à la fin du XIXe siècle, à exploiter l'information conservée que l'on appelle documentation . Dans son article "Visions of Xanadu", Rayward rend compte des travaux d'Otlet et de ses collègues qui constituent "une part importante et négligée de l'histoire des sciences de l'information".

Avec Henri Lafontaine (1853-1943), Otlet fondait en 1892, à Bruxelles, l'Office international de bibliographie qui devint en 1895 L'Institut international de Bibliographie et finalement en 1931 l'Institut international de Documentation. Ce dernier changement de nom traduisait l'importance grandissante de l'information et de son exploitation. Par expansion des champs d'action, ce qui était la "bibliographie" est devenu la "documentation" puis les "sciences de l'information".

En 1934, Otlet publiait son magistral Traité de documentation qui était une synthèse de ses 40 ans de pratiques documentaires. Le traité de documentation est également le premier ouvrage moderne traitant du problème général de l'organisation de l'information et est resté pendant des années un ouvrage fondamental en documentation (Chaumier 1971, 7). Dans cet ouvrage, Otlet présentait également une vision très imaginative de l'avenir de la documentation qui est tout aussi révolutionnaire que celle de Bush. Il entrevoyait les possibilités de la télévision, l'importance de la documentation sonore et même l'arrivée d'une documentation tactile, gustative et olfactive! Pour Otlet tous ces documents nouveaux apportés par des médias tels la télévision, la radio, le cinéma, etc., avaient des objectifs similaires à ceux du livre: informer, communiquer. Il proposait de les appeler "des substituts de livres". Otlet avait également travaillé avec Robert Goldschmidt à développer des applications bibliographiques sur microfilm (L'Encyclopaedia Microphotica Mundaneum).

Il spécula également sur la "station de travail du chercheur" qui était, selon Rayward, un MEMEX hypermédia. Cette station devait intégrer des instruments auxiliaires au travail intellectuel tels la transcription de la voix vers le texte, la lecture à distance, l'ajout d'annotations à des textes à distance (ce qui est une fonction importante de certains hypertextes aujourd'hui) sans modifier l'original. Bref, une machine qui augmenterait l'intellect humain comme celles proposées plus tard par Bush, Nelson ou Engelbart.

Rayward rend également compte des réalisations impressionnantes d'Otlet, compte tenu des moyens technologiques de l'époque. Sa technologie, c'était la fiche de carton normalisée de 3 X 5 pouces (sic!). Il en est arrivé à construire un immense instrument de recherche hypertexte manuel et multimédia. Otlet consignait sur des fiches de grandeur standardisée des informations concernant des ouvrages; ces informations peuvent être assimilées aux "noeuds" de l'hypertexte. Les liens étaient assurés par la Classification Décimale Universelle qu'Otlet créa à partir de la classification décimale de Dewey avec la permission de ce dernier, à condition que la CDU ne soit pas traduite en anglais. Peut-être est-ce là une partie de l'explication de la méconnaissance d'Otlet dont font preuve les américains, l'autre étant que le traité fut publié en français.

Otlet consignait également des notices concernant des ressources iconographiques, également liées au moyen du code de la CDU. Otlet et Lafontaine mirent en place un réseau documentaire international pour utiliser et enrichir leur documentation. Si bien qu'en avril 1934, Otlet notait que sa base de données comptait plus de 15 millions six cent mille fiches! D'autres écrits signalent qu'en 1912, il y avait un quart de million d'images dans la base de données d'images et le répertoire encyclopédique des dossiers comportait 1 million d'items dans 10,000 dossiers (Rayward 1995, 238).

Ces travaux dénotent une prescience aussi remarquable que celle de Bush même si Rayward nous met en garde de sauter trop vite aux conclusions et apporte des nuances en nous situant dans le contexte intellectuel de la fin du XIXe siècle.

5.3 H. G. Wells

Par la suite, on trouve un autre visionnaire dans la personne de l'écrivain britannique H.G. Wells. Dans une conférence donnée en 1936 et publiée en 1938, Wells exposait bien avant Bush sa conception d'une encyclopédie mondiale qui pourrait: "... spread like a nervous network... knitting all the intellectual workers of the world through a common interest and a common medium of expression into a more and more conscious cooperating unity" (cité par McKnight et al 1992, 231).

5.4 Douglas C. Engelbart

Le professeur américain Douglas C. Engelbart, travaille sur l'hypertexte depuis plus de 30 ans. Engelbart a été fortement influencé par le rêve de Bush. Il révèle lui-même ce fait dans une lettre qu'il expédia à Bush le 24 mai 1962 pour lui demander la permission de citer son As we May Think: "I might add that this article of yours has probably influenced me quite basically" (cité dans: Nyce et Kahn 1991, 235-236). Son projet, qu'il a appelé Augment vise à améliorer de façon significative la résolution de problèmes chez les humains. Pour ce faire, il a tenté d'identifier les facteurs limitant le niveau d'efficacité des individus et de trouver des moyens pour augmenter cette efficacité. Dans ses efforts, le docteur Engelbart a utilisé les moyens technologiques les plus appropriés pour parvenir à ses fins. Son équipe de travail est multidisciplinaire: on y retrouve des psychologues, des programmeurs, des ingénieurs en informatique, des spécialistes en intelligence artificielle, en analyse de systèmes, en "display engineering", en management, en psycho-linguistique et enfin des spécialistes en information. Il a inventé de nombreux outils reliés de près à la technologie hypertexte telle que nous la connaissons aujourd'hui: l'édition de texte à l'écran, la souris, les liens entre différents ensembles d'information, les fenêtres, l'hypermédia, des concepts de bureautique etc. On le voit, l'hypertexte est une technologie issue d'une longue maturation multidisciplinaire. Cette technologie qui nous semble si nouvelle n'est pas arrivée spontanément et les recherches d'Engelbart en ce domaine depuis plus de 30 ans en font un des piliers de l'hypertexte.

5.5 Theodor Holm Nelson

Theodor Holm Nelson, un autre américain, a créé le terme hypertexte en 1965. Il est aussi le créateur du projet Xanadu. Xanadu est un système littéraire global qui, selon la vision de son créateur, doit servir de dépôt permettant la consultation et l'achat des droits des documents déposés. Xanadu est le premier système à se préoccuper du droit d'auteur et à prévoir la perception automatique de ces droits. Nelson est donc un visionnaire car, même si l'explosion des applications hypertextuelles est phénoménale, ce n'est qu'un prélude au déferlement futur lorsque ces questions de droits auront été réglées.

Dans un article intitulé As we will think, présenté à la "International Conference on interactive computing", en Angleterre en 1972, Nelson expose le chemin parcouru depuis l'article de Bush et indique les développements à venir. Ce texte est étonnant. Il signale d'abord les erreurs de Bush, notamment au niveau de l'indexation. Nelson écrit que toutes les recherches dans les systèmes de recherche de l'information s'occupent d'indexation ou de représentation du document de telle façon qu'il puisse être cherché mécaniquement et décodé. D'après Nelson, Bush a eu peu de successeurs dans le champ de la recherche automatisée de l'information. Ensuite, Nelson indique les développements à venir. Pour lui, l'aspect économique est important. On a vu récemment qu'il avait raison. Lors de l'arrivée en bourse de la compagnie Netscape, la frénésie du marché a montré que les investisseurs ont, eux aussi, noté le potentiel économique de l'hypertexte sur l'Internet.

Nelson aborde également les périodiques électroniques "The next step is, of course, the creation of hyper-magazines or journals" (cité dans Nyce et Kahn 1991, 258) et prévoit que tout commencera dans les universités, les centres de recherche et les gouvernements. Étonnant visionnaire: l'Internet n'avait alors que 4 ans et ne reliait que 23 sites. Le courrier électronique et le telnet furent inventés cette même année. La faisabilité économique était encore un obstacle à cause du coût des équipements, liaisons, mémoire, ordinateurs. Néanmoins, Nelson, par ses recherches, demeure un autre acteur fondamental de l'hypertexte.

Précisons quelque peu la conception des "pistes associatives" chez Nelson. Ce dernier est en désaccord avec Bush sur ce point. Pour Nelson, la structuration des connaissances par un auteur risque d'être arbitraire et donc inintéressante pour les lecteurs individuels. Étant donné que la structure cognitive de chaque individu est basée sur ses expériences antérieures, son éducation et ses capacités, Nelson croit que la façon dont chacun accède, interagit et interrelie les connaissances devrait être aussi distincte. Le lecteur devrait donc idéalement pouvoir modifier le texte et ses liens pour le rendre plus signifiant pour lui. Donc, le texte devrait s'adapter à son lecteur plutôt que l'inverse.

5.6 Bill Atkinson

HyperCard a été développé en 1987 par Bill Atkinson. Du fait qu'Apple l'intégrait sans frais supplémentaires à ses ordinateurs, HyperCard a été le premier logiciel hypertexte grand public. À ce titre, son créateur mérite une place dans notre petit panthéon.

Une application est composée de cartes (souvenons-nous des cartes 3X5 d'Otlet!) correspondant à une page-écran. Ces cartes sont créées à l'aide d'outils de traitement de texte et de dessin. Les liens entre les cartes sont effectués au moyen de boutons.

C'est un logiciel intégré qui permet trois fonctions: se balader (browser) dans des piles de cartes, éditer ces cartes et enfin, programmer des liens plus complexes au moyen d'un langage objet (Hypertalk).

5.7 Tim Berners-Lee et le World Wide Web

Il y a de nombreux autres grands noms dans l'histoire de cette technologie. De multiples systèmes hypertextes ont été créés: Ramaiah (1992) en dénombre une centaine. Mais il est maintenant impossible de ne pas mentionner un dernier nom: Tim Berners-Lee et une des plus belles applications de l'hypertexte: le World Wide Web.

Le WWW est un réseau de serveurs, faisant partie de l'Internet, qui utilisent des liens hypertextes pour accéder à l'information. Ce projet développé au CERN (Conseil Européen pour la Recherche Nucléaire) depuis 1989 a réellement pris son envol avec la diffusion grand public d'un logiciel de navigation appelé Mosaic en 1993. Depuis, la progression est phénoménale: dans un rapport récent (Davis 1995), on mentionne qu'en juin 1994, il y avait 600 sites WWW. Ces sites généraient 5 % du trafic sur l'Internet. En mai 1995, il y en avait 16,000 qui généraient 20% du trafic. Le rapport prévoit que 40% du trafic de l'Internet sera destiné au WWW en 1995. Il ne s'agit pas ici d'examiner ce qu'est le WWW mais plutôt la technologie sous-jacente: l'hypertexte.

Tim Berners-Lee a dirigé les travaux du CERN qui ont mené à la création du Web. Berners-Lee et ses collègues décidèrent d'utiliser un système de marquage des textes qui séparait les données du traitement qu'on leur fait subir: le HTML (Hyper Text Markup Language). Ces travaux précisèrent également comment accéder aux autres ressources en utilisant des URL (Uniform Resource Locators) qui sont une forme d'adressage standardisée. Enfin, ils aboutirent au Hyper Text Transfer Protocol (HTTP), le protocole que les ordinateurs doivent utiliser pour transférer des documents hypertextes. Tout ce travail de normalisation fait que différents systèmes peuvent aujourd'hui lire la même information et qu'un réseau hypertexte mondial fait maintenant partie de notre quotidien (ou le fera bientôt!).

6. SGML ET HTML

Le système de marquage proposé par le CERN est inspiré du langage SGML (Standard Generalized Markup Language) qui est devenu la norme ISO 8879 en 1986. Le langage HTML (Hyper Text Markup Language) utilisé sur le Web est un sous-ensemble SGML, une DTD (Data Type Definition) hypertextuelle. Il précise les types d'étiquettes à utiliser dans un hyperdocument, la relation entre les étiquettes, l'ordre dans lequel elles apparaissent dans le document, les éléments structuraux (en-têtes, listes, paragraphes etc.) et les liens avec les autres documents sur l'Internet. Les baladeurs du Web (Mosaic, Netscape, Cello, Lynx, etc) sont conçus pour lire et interpréter du HTML. Ce langage a toutefois des limitations importantes (voir à ce sujet: Price-Wilkin, 1994) mais il est alors possible de développer des passerelles entre la DTD HTML et des logiciels permettant des traitements plus complexes. Ces passerelles sont appelées des CGI (Common Gateway Interface). Une CGI est simplement un programme servant de lien entre le serveur WWW et un autre programme, par exemple une base de données, qui est situé sur ce serveur. La CGI est activée par une commande provenant du client WWW.

La DTD du Texte Encoding Initiative qui sert à décrire des documents textuels complexes comporte des centaines d'étiquettes alors que HTML en compte quelques douzaines. De toute façon, le Web est encore très jeune et son langage a déjà été révisé et sera ajusté progressivement aux possibilités de l'informatique. Il importe toutefois de noter que pour avoir de véritables applications bibliothéconomiques sur le Web, ces limitations devront être surmontées. Par exemple, des structures telles que chapitre, section ou poème ne sont pas représentées en HTML.

Un exemple suffira pour comprendre les limitations du HTML. De par son appartenance au SGML, il va de soi que la notion de structure existe en HTML (ex. titre, paragraphe, liste etc.) mais le HTML est présentement incapable de livrer une partie seulement de la structure. Ainsi, HTML définit un glossaire et un élément d'un glossaire mais est incapable d'expédier cet élément. Pour avoir une seule définition du Oxford English Dictionary, HTML expédierait le fichier entier soit 500 méga octets. Des solutions existent mais elles ne proviennent pas du HTML. En attendant, ces limitations forcent les concepteurs de documents HTML à les fragmenter en petits sous-ensembles de façon à faire circuler sur le réseau des fichiers de grosseur acceptable.

Les changements arrivent toutefois à une vitesse folle. Ainsi, on peut maintenant greffer au logiciel Mosaic un lecteur SGML. La compagnie torontoise Softquad <URL: http://www.sq.com/> distribue depuis peu (été 1995) le logiciel Panorama qui permet de lire directement des documents en SGML. Les textes codés en SGML sont transmis avec leur DTD et interprétés par Panorama. Le SGML permet de diffuser des documents plus longs et plus complexes sur le WWW. Il permet également un meilleur contrôle de l'affichage et de la recherche dans la structure d'un document. Par exemple, chercher un mot dans un titre plutôt que dans tout le document. Le SGML et le logiciel Panorama suscitent beaucoup d'intérêt car les applications bibliothéconomiques sont évidentes. La preuve en est qu'on peut obtenir Panorama depuis la division de la recherche chez OCLC (Online Computer Library Center, Inc.) <URL: http://www.oclc.org:5046/oclc/research/panorama/panorama.html>.

7. APPLICATIONS BIBLIOTHÉCONOMIQUES

L'Internet est en pleine mutation et nous sommes à la veille d'assister à son exploitation commerciale. Dans le "Internet Time Line" <URL: http://tig.com/IBC/Timeline.html>, on note l'intérêt des milieux d'affaires seulement à compter de 1993 (ce qui coïncide avec l'arrivée du baladeur du Web Mosaic). Les centres commerciaux (shopping malls) ne sont apparus qu'en 1994. En mai 1995, le noeud dorsal de l'Internet du National Science Fundation (NSF backbone) a été remplacé par un réseau de fournisseurs interconnectés. Toutes ces applications commerciales n'auraient pas été possibles sans les possibilités beaucoup plus conviviales offertes par les applications hypermédia développées par ces précurseurs qu'ont été Otlett, Bush, Engelbart, Nelson, Atkinson, Berners-Lee et quelques autres.

Les bibliothèques n'ont pas tardé à s'intéresser à ces phénomènes. En fait elles font partie des premiers utilisateurs de l'internet. Les applications bibliothéconomiques sont déjà très nombreuses et constitueraient à elles seules matière à un article très étoffé. Voici simplement quelques belles réalisations.

  1. À l'adresse suivante, on a assemblé toutes sortes d'applications innovatrices utilisant l'Internet ou, spécifiquement, le WWW basé sur HTML puisque cet article veut mettre en relief les applications utilisant l'hypertexte dans des bibliothèques: <URL: http://frank.mtsu.edu/~kmiddlet/libweb/innovate.html>.

  2. Pour le développement des collections et les acquisitions, ce site rassemble une foule de ressources: <URL:http://www.library.vanderbilt.edu/law/acqs/acqs.html>.

  3. Une liste de discussion vous permettra de vous tenir à jour. Web4lib est orientée spécifiquement pour les bibliothécaires utilisant le WWW. Pour avoir une idée des sujets abordés, voir: <URL:http://library.berkeley.edu:80/ISIS/web4lib.html>.

  4. Et ces applications ne concernent pas seulement les bibliothèques universitaires. Allez voir ce que cette bibliothèque publique de South Bend en Indiana a réalisé! <URL:http://sjcpl.lib.in.us/> . Vous y trouverez également la liste des autres bibliothèques publiques reliées à l'Internet.

La liste pourrait s'allonger ainsi ad nauseam alors, allez voir par vous-même, interrogez les outils de recherche disponibles et vous constaterez rapidement la présence en force de nombreux collègues bibliothécaires.

7.1 Format MARC - champ 856

Le nouveau champ 856 du format de catalogage MARC permet de décrire l'adresse URL (Universal Resource Locators) d'un document. Ce champ promet d'être révolutionnaire pour les bibliothèques. Lorsque l'usage de ce champ sera plus répandu, les catalogues de bibliothèques comprendront des hyperliens pointant à l'extérieur de la bibliothèque. Il sera par exemple possible de récupérer des documents électroniques même si la bibliothèque n'a pas physiquement le document "intra muros". On peut retrouver un bon exemple des possibilités offertes par ce champ 856 en consultant le catalogue de l'OCLC qui est en accès gratuit. <URL: http://www.oclc.org:6990>. Il est très agréable de consulter cette immense bibliographie hypertextuelle; ça donne un avant-goût de la bibliothèque du futur!

Il existe maintenant des DTD du format MARC. On voit apparaître régulièrement des questions à ce sujet sur les listes de discussions du Usenet. Le fait d'avoir une DTD permet d'entrevoir des baladeurs du Web ou des interfaces qui pourront lire encore plus directement le MARC.

7.2 Bibliothèque virtuelle

L'hypertexte permet donc maintenant d'envisager la bibliothèque virtuelle. D'ailleurs le School of Information and Library Studies de l'Université du Michigan vient d'ouvrir la première bibliothèque publique de l'Internet en mars 1995 avec des employés répartis à travers le monde, (propriétés de délocalisation et de travail en collaboration.) (URL: http://ipl.sils.umich.edu)

7.3 La norme Z39.50

La généralisation de la norme Z39.50 permettra, au moyen du Web, de transmettre des requêtes de recherche. Par exemple, la recherche de documents pour le PEB (Prêt Entre Bibliothèques) pourrait être effectuée par une interface intelligente qui transmettrait les requêtes à un nombre prédéterminé de bibliothèques suivant des critères de disponibilité et de proximité. Ces robots de connaissances permettraient d'avoir enfin un catalogue collectif des bibliothèques. La série de catalogues OPAC est actuellement peu utile si on est obligé de faire la même recherche dans dix catalogues différents avant de trouver le document que l'on cherche. Les liens hypertextes entre différents catalogues et la possibilité de transmettre une requête d'un lien à l'autre serait une grande amélioration.

Déjà, quelques bibliothèques permettent un branchement à partir du Web avec des formulaires (par exemple, l'université Stanford. <URL: http://lindy.stanford.edu/~asc/dir.CGI>). Précisons bien qu'il s'agit ici d'une vraie liaison hypertexte (HTTP) et non d'une simple liaison telnet. Ces interfaces (Z39.50-WWW) sont en développement mais on peut déjà prévoir qu'elles se répandront rapidement.

7.4 Le catalogage

Le catalogage, qui est traditionnellement une activité isolée du public, confinée dans les services techniques, pourra, dans un environnement totalement électronique (outils de catalogage "en ligne", ouvrages électroniques), revenir au "premier étage" (en raison notamment de "l'allègement" de l'équipement papier nécessaire). De nombreux travaux sont en cours à ce sujet. La liste de discussion INTERCAT, récemment formée (Listserv@OCLC.org) s'intéresse entre autres choses à: "Use of the Marc format, AACR2 or other technicalities related to Internet resources; selecting Internet resources for cataloging; criteria and policies ... Determining and encoding electronic location and access information (field 856) ... Preservation, database stabiblity, and long-term access". Bref, même si le support change, les préoccupations bibliothéconomiques de toujours demeurent.

CONCLUSION: DES DÉFIS PASSIONNANTS (ET DONC QUELQUES OBSTACLES...)

Mais tout n'est pas rose. L'intrusion des grands serveurs commerciaux dans l'Internet risque de poser de nombreux défis aux bibliothécaires. Qui va payer pour les coûts d'amélioration de l'infrastructure? L'industrie du divertissement demande une plus grande bande passante dont nous allons profiter mais quand viendra le temps de distribuer l'information aux usagers, pourra-t-on faire compétition à Compuserve, America Online et Delphi? Est-ce que les gouvernements permettront aux bibliothèques d'être des acteurs importants de ce domaine? Les bibliothécaires pourront-ils continuer à assumer leur rôle d'agents de démocratisation de l'information et contribuer à la réduction de "l'analphabétisme informatique" qui risque de créer deux classes de citoyens, les riches et les pauvres en information?

La NASA distribue des fonds importants pour le "public use of Earth and Space Science Data Over the Internet" visant à développer des technologies pour la bibliothèque digitale (voir par exemple <URL: http://dlt.gsfc.nasa.gov/>). Vous pourrez lire les projets de Stanford, Berkeley, Carnegie Mellon . Espérons que cette initiative de la NASA se répandra et que les gouvernements auront assez de vision pour l'appuyer. Actuellement, il semble que ce soit le cas: des bibliothécaires figurent sur les conseils d'administration de plusieurs groupes de travail sur l'autoroute de l'information (aux États-Unis, au Canada). De toute façon, devant la complexité des services sur l'Internet, il y aura un besoin de plus en plus grand de "cyberthécaires" pour effectuer, à l'échelle de la planète, le travail effectué depuis toujours dans nos bibliothèques: acquisition, sélection, conservation, diffusion, catalogage, indexation. Ces besoins existent toujours et sont même décuplés à cause de la masse d'information électronique qui déferle sur les usagers désorientés. Il ne s'agit uniquement pour nous que de maîtriser les technologies comme l'hypertexte. Il faudra également travailler à l'imposition et au maintien de standards. Le HTML par exemple est menacé par des langages concurrents ou non standards comme, entre autres, les ajouts au HTML 2 imposés par le fabricant du logiciel balladeur du WWW actuellement le plus populaire, Netscape.

Autres problèmes, en vrac: qui s'assurera de la conservation des documents électroniques si ce ne sont les bibliothèques. Comment assurer l'intégrité de données si facilement modifiables? Comment s'assurer de localiser de façon permanente un document hypertexte? Le URL (Uniform Ressource Locator) permet de localiser un document à un endroit mais qu'arrive-t-il quand ce document est déplacé, effacé ou modifié? Où sont les objets perdus sur Internet? On parle d'allouer des URN (Universal Resource Name), une localisation qui serait permanente, un peu comme les ISBN. Comment citer un document hypertexte?

D'autre part, dans l'Internet, le sublime côtoie le vulgaire et le texte le plus génial peut voisiner l'idiotie la plus pure. Comment valider et sélectionner ces textes et établir des liens avec d'autres hypermédias, sur quels critères ? Qui est mieux placé qu'un bibliothécaire pour se pencher sur ces questions qui font partie de notre pratique quotidienne avec les médias traditionnels depuis toujours? La tâche était relativement plus simple lorsque le savoir était "stabilisé" dans un livre. Maintenant, nous devons apprendre à travailler avec un savoir mouvant, nous devons gérer des flux d'information. Il nous faut, pour ce faire, exercer une constante veille technologique et documentaire.

Tous ces problèmes générés par les technologies hypertextes sont autant de créneaux d'excellence et de défis à développer par les bibliothécaires (voir à ce sujet: Guédon 1995 et Shaw 1994). Jean-Claude Guédon suggère également d'autres pistes de réflexions à ceux qui craindraient les changements apportés par la numérisation des textes et les réseaux de communication: mise en forme de l'information, publications, production d'information. Notre profession se redéfinit. Mieux vaux examiner toutes les options que nous offrent les nouvelles technologies si on ne veut pas subir le sort des typographes...

Notre longue parenthèse historique visait à souligner les contributions diverses de tous les milieux à l'hypertexte. Cette technologie doit être vue dans un continuum auquel les spécialistes de l'information ont toujours rêvé et participé. D'ailleurs de nombreux bibliothécaires sont associés aux travaux en ce domaine et participent déjà à l'élaboration de la bibliothèque numérique. La connaissance de cette technologie doit également nous permettre de comprendre ce qu'il y a de révolutionnaire dans l'hypertexte et d'élargir nos référents qui ont toujours été le livre pour entrevoir pleinement les différences et les potentialités de ce nouveau médium de diffusion de l'information. L'hypertexte doit être vu comme un élément intégrateur des outils d'accès à l'information numérisée. Il facilite notre tâche. Nous ne pouvons tout simplement pas l'ignorer, il s'agit d'une "tendance lourde" en sciences de l'information.

BIBLIOGRAPHIE

Balpe, Jean Pierre. Hyperdocuments Hypertextes Hypermedias. Paris: Eyrolles, 1990.

Barry, Jeff. "The HyperText Markup Language (HTML) and the World- Wide Web: Raising ASCII to a New Level of Usability." The Public- Access Computer Systems Reviews 5, no 5 (1994): 5-62.

Borgman, Christine et Bruce Hentsell "Hypertext: What's in a Name" Bulletin of the American Society for Information Science 15, no 5 june-july (1989): 22.

Boutell, Thomas. World Wide Web Frequently Asked Questions. Version mise à jour fréquemment .

<URL: http://sunsite.unc.edu/boutell/faq/ www_faq.html.>

Buckland, Michael K. "Emanuel Goldberg, Electronic Document Retrieval, and Vannevar Bush's Memex." Journal of the American Society for Information Science 43, no 4 (1992): 284-294.

Burke, Colin. "The Other Memex: The Tangled Career of Vannevar Bush's Information Machine, The Rapid Selector." Journal of the American Society for Information Science 43, no 10 (1992): 648-657.

Bush, Vannevar. "As We May Think." The Atlantic Monthly 176, no 1 (1945): 101-108.

Chaumier, Jacques. Les techniques documentaires. Que sais-je?, 1419. Paris: Presses Universitaires de France, 1971.

Davis, Paul J. The World Wide Web : Industry Analysis. New York: J.P. Morgan Securities Inc., May 5, 1995.

<URL: http://www.jpmorgan.com/MarketDataInd/Research/WebReport/page1.html>

Estivals, Robert. La bibliologie. Que sais-je?, 2374. Paris: Presses Universitaires de France, 1987.

Guédon, Jean Claude. "Les bibliothèques à l'heure des réseaux télématiques planétaires." Argus 23, no 3 (September 1994): 9-14.

Jonassen, David H. Hypertext/Hypermedia. Englewood Cliffs, New Jersey: Educational Technology Publications, 1989.

Kinnell, Susan K. et Carl Franklin. "Hypercard and Hypertext: A New Technology." In Encyclopedia of Library and Information Science, vol. 49: 278-295. Exec. ed. Allen Kent. New York: Marcel Dekker, 1992.

Kinney, Thomas. "Memex meets Madonna: multimedia at the intersection of information and entertainment." The Electronic Library 10, no 3 (1992): 133-138.

Laufer, Roger, and Domenico Scavetta. Texte, hypertexte, hypermédia. Que sais-je?, 2629. Paris: Presses Universitaires de France, 1992.

Le Crosnier, Hervé. "L'hypertexte en réseau : repenser la bibliothèque." Bulletin des bibliothèques de France 40, no 2 (1995): 23-31.

Maignien, Yannick. "La bibliothèque virtuelle : ou de l'ars memoria à Xanadu." Bulletin des bibliothèques de France 40, no 2 (1995): 8-17.

McKnight, Cliff, Andrew Dillon, et John Richardson. "Hypermedia." In Encyclopedia of Library and Information Science, vol. 50: 226- 255. Exec. ed. Allen Kent. New York: Marcel Dekker, 1992.

Morgan, Eric Lease. "The World Wide and Mosaic: An Overview for Librarians." The Public-Access Computer Systems Reviews 5, no 6 (1994): 5-26. <URL: gopher://info.lib.uh.edu/11/articles/e-journals/uhlibrary/pacsreview>

N.B. Cette excellente revue est maintenant accessible en hypertexte à compter du volume 6 à l'adresse suivante: <URL: http://info.lib.uh.edu/pacsrev.html>

Nyce, James M., Kahn Paul. From Memex to Hypertext: Vannevar Bush and the Mind's Machine. Boston: Academic Press, 1991.

Olszewski, Lawrence. "Hypertext Applications." Library Hi Tech Bibliography, vol. 5: 105-114. Ann Arbor, Mich.: Pieran Press, 1990.

Price-Wilkin, John. "Using the World-Wide Web to Deliver Complex Electronic Documents: Implications for Libraries" The Public-Access Computer Systems Reviews 5, no 3, (1994): 5-21. <URL: gopher://info.lib.uh.edu/11/articles/e-journals/uhlibrary/pacsreview>

Rada, Roy. Hypertext : from text to expertext. London: McGraw Hill, 1991.

Ramaiah, C. K. "An Overview of Hypertext and Hypermedia." International Information, Communication & Education 11, no 1 (1992): 26-42.

Rayward, W. Boyd. "Visions of Xanadu: Paul Otlet (1868-1944) and Hypertext." Journal of the American Society for Information Science 45, no 4 (1994): 235-250.

Rey-Debove, Josette et Alain Rey, éditeurs. Le Nouveau Petit Robert : dictionnaire alphabétique et analogique de la langue française. Paris, Dictionnaires Le Robert, 1995.

Salvan, Paule. "Bibliothèque" dans Encyclopédie française, vol. 3: 1693-1696. Paris: Larousse, 1972.

Shaw, Debora. "Libraries of the Future: Glimpses of a Networked, Distributed, Collaborative, Hyper, Virtual World." Libri 44, no 3 (1994): 206-223.

Stern, David. "Expert Systems: HTML, the WWW, and the Librarian." Computers in Libraries 15, no 4 (April 1995): 56-58.