ISSN 1201-7302 | Cursus vol. 9 no 1 (AUTOMNE 2005) |
VÉRONIQUE REED
Cursus est le périodique électronique étudiant de l'École de bibliothéconomie et des sciences de l'information (EBSI) de l'Université de Montréal. Ce périodique diffuse des textes produits dans le cadre des cours de l'EBSI.
Courriel : cursus@ere.umontreal.caTout texte demeure la propriété de son auteur. La reproduction de ce texte est permise pour une utilisation individuelle. Tout usage commercial nécessite une permission écrite de l'auteur.
Véronique Reed a étudié à l'EBSI (Université de Montréal) à titre d'étudiante libre. Elle est diplômée de maîtrise en histoire à l'Université du Québec à Montréal. Elle a récemment collaboré au projet de Portail International Archivistique Francophone (PIAF) de l'Association internationale des Archives francophones (AIAF).
Devant le problème de la détérioration de certains supports d'images fixes et, par le fait même, des difficultés qu'elle entraîne concernant leur utilisation, les archivistes et autres spécialistes des sciences de l'information se sont intéressés à la possibilité de numériser certains documents. Toutefois, la numérisation n'est pas une «solution miracle». Les procédés sont variés. La technologie évolue rapidement. Dans ce contexte, quels aspects devons-nous considérer lorsque nous envisageons de procéder à la numérisation de documents? Afin de répondre à cette question, quatre grands thèmes seront abordés: la sélection des documents, primordiale dans un contexte où les ressources disponibles sont limitées; le procédé de numérisation; la question des métadonnées, qui paraît avoir pris énormément d'importance dans le contexte d'explosion de la masse documentaire numérique; et, enfin, la préservation à long terme des images fixes sur supports numériques.
La masse documentaire, qu'il s'agisse d'images fixes ou autres, a atteint des sommets importants, et la tendance actuelle ? c'est-à-dire la création et la duplication de documents en cette ère numérique ? ne va qu'amplifier le phénomène. Cependant, il n'en va guère de même concernant les ressources qui, humaines ou monétaires, sont beaucoup plus rares. Dans ce contexte, il importe d'opérer une sélection judicieuse, que ce soit à l'étape de la conservation ou à celle de la numérisation. La littérature fait état de nombreux critères d'évaluation dans le domaine de la numérisation. Nous en examinerons ici quelques-uns parmi les plus importants.
La valeur des documents est sans doute l'un des critères les plus importants dans le processus de sélection. Cette valeur elle-même se compose de différents aspects. L'un de ceux-ci est ce que D. Vogt-O'Connor nomme la «valeur artéfactuelle», liée à la nature même des documents1. L'originalité de ceux-ci, leur rareté et leur condition entrent ici en ligne de compte2. Dans le cas précis des images fixes, quelques questions se posent: les photographies sont-elles originales ou sont-elles de simples reproductions de documents originaux conservés dans une autre institution? L'affiche est-elle rare ou en retrouvons-nous de nombreux exemplaires? L'état des négatifs permet-il d'obtenir un document numérique sur lequel l'information apparaît clairement?
Sont aussi à considérer la valeur de témoignage ? valeur d'information, selon le terme de D. Vogt-O'Connor3-, qui consiste en la qualité4 et la quantité d'information contenue dans les collections, et en leur valeur historique. À cet effet, les images apportant un éclairage significatif sur des personnes, des lieux, des événements, des pratiques, etc., et celles ayant une valeur de preuve méritent notre attention. Plus un document offre de renseignements, plus il jouit de valeur de témoignage. Prenons le cas du tableau William Penn's Treaty with the Indians, when he founded the province of Pennsylvania in North America de Benjamin West (1771). Elle peut servir à l'étude des relations entre les Blancs et les Amérindiens, à celle de la représentation des indigènes par les Blancs, à celle des costumes et de la culture matérielle, à celle de l'artiste peintre Benjamin West, à l'histoire de la fondation de la Pennsylvanie, et à celle de la peinture du XVIIIe siècle. Le potentiel de l'image est donc manifeste. En peu de mots, l'objectif est de sélectionner un minimum de documents offrant un maximum d'information à un maximum d'individus5.
La valeur est, entre autres, liée aux besoins des utilisateurs. R. Atkinson indique, à propos de la priorité de l'utilité des documents, que «usefulness is the ultima ratio for all collections.»6 Les images qui, intrinsèquement, détiennent un énorme potentiel informatif mais qui ne trouvent guère d'utilisateurs sont alors susceptibles de ne pas avoir priorité. Mais les besoins de la recherche peuvent changer7 au cours des années et il faut prendre garde de totalement ignorer ces images de valeur.
Certains documents sont particulièrement sensibles au temps et aux éléments. C'est notamment le cas des photographies, comme l'explique F. Frey: «The materials that make up photographs are not chemically stable. These materials include silver or dyes as image-forming materials; paper, celluloid, or other plastics as base materials; and gelatin, albumen, or collodion as binders.»8 À cette instabilité s'ajoutent les conditions de conservation qui, si elles ne sont pas optimales9, contribuent à la dégradation des originaux. Le danger de voir les supports comme leur contenu irrémédiablement perdus demeure un incitatif majeur à faire de la numérisation une priorité.
La manipulation des documents constitue une autre grande menace à leur préservation. Les photographies, les négatifs ? notamment ceux sur verre, qui sont d'une fragilité considérable ? et les grands formats (cartes, plans et affiches), pour ne nommer que ces types de supports, exigent une manipulation soigneuse, qu'ils soient en bonne ou en mauvaise condition. Il est clair que même la plus délicate manipulation, lorsque répétée à maintes reprises, ne suffit pas à assurer la préservation des documents visuels. Nombreux sont les auteurs qui préconisent leur numérisation comme moyen de limiter leur manipulation, tout en assurant leur accès. C'est ainsi que S. Tanner et J. Lomax proposent que la copie numérique devienne le document d'usage usuel, et que l'original ne soit jamais, ou très rarement, consulté10. Sans être aussi catégorique, S.E. Ostrow favorise l'usage des copies numériques afin de permettre aux usagers de déterminer quels sont les documents qu'ils doivent absolument consulter sous leur forme originale, ce qui restreint la manipulation à ces seules images sélectionnées11. La prudence est également de rigueur chez S.G. Nichols et A. Smith, qui prônent l'utilisation des copies numériques afin de limiter l'usage ? et la détérioration ? des originaux, sans toutefois qu'elles servent à les remplacer complètement. La technologie numérique est récente et, soutiennent-ils, n'a pas encore fait ses preuves comme moyen de préservation à long terme12.
Ajoutons que la numérisation peut servir la préservation en ce sens qu'elle donne accès au contenu visuel des documents tout en permettant de conserver ceux-ci dans des endroits sécuritaires. Les risques de vols, dans le cas de pièces particulièrement rares et précieuses, se trouvent ainsi fort diminués.
La numérisation, tel que mentionné ci-haut, assure à la fois la préservation des documents et leur accès. La fragilité, l'état de détérioration ou les difficultés de manipulation des originaux sont autant de limites à leur utilisation. Les copies numériques s'avèrent donc un moyen d'élargir et d'encourager l'accès à ces documents. S. Tanner et J. Lomax suggèrent même qu'une nouvelle clientèle peut se constituer grâce à cet élargissement de l'accès13.
Comme l'écrit si justement A. Smith: «digitization is access - lots of it.»14 Mentionnons, à titre d'exemple, le cas de l'Arquivo Fotografico da Camara Municipal de Lisboa (AFCML), qui illustre bien comment la mise sur pied d'une collection numérique favorise hautement l'accès. Cette institution conserve une importante collection photographique ? environ 350 000 images ? témoignant de l'histoire de Lisbonne (Portugal). Or, ce sont les images disponibles sous forme numérique et répertoriées dans des catalogues informatisés ? 60 000 images en 1998 ? qui sont le plus fréquemment consultées. Les nombreux usagers, principalement des étudiants, mais aussi des chercheurs et des journalistes, ont la possibilité d'obtenir une copie de ces images. Qui plus est, à de nombreux négatifs ne correspond aucune copie imprimée. Ces documents visuels sont toutefois disponibles sous forme numérique15, ce qui permet de les consulter aisément. Il appert donc que la numérisation facilite grandement l'accès aux documents.
La numérisation des documents permet également, par l'usage d'outils informatiques, de rendre lisible - donc accessible - des documents fort détériorés. A. Smith rend compte de l'intéressant cas de la carte du District de Columbia, oeuvre de Pierre-Charles L'Enfant datant de 1791. Fort décolorée, elle offre bien peu d'information dans son état physique actuel. Or, grâce à des manipulations effectuées sur la copie numérique, les détails de l'instrument géographique, dont les annotations de Thomas Jefferson, apparaissent désormais16. Le document peut donc à nouveau être consulté.
Par la numérisation et la mise en ligne subséquente des collections, l'accès aux documents se trouve aussi largement étendu. Les usagers à mobilité réduite, ceux géographiquement éloignés du centre de conservation et ceux insatisfaits de ses heures d'ouverture peuvent, moyennant l'accès à Internet, consulter les images mises à leur disposition. Les élèves peuvent accéder à une variété d'images à partir de leur salle de cours. Les chercheurs peuvent limiter de coûteux déplacements et accéder à des sources, plus nombreuses, et dispersées à travers le monde, ce qui favorise leurs recherches. En somme, cette stratégie peut avoir des répercussions sociales et culturelles bénéfiques. Par contre, une telle entreprise nécessite l'assurance que le droit d'auteur sera respecté, notamment par la mise en place de mesures de contrôle.
Nous avons une masse d'images à numériser. Nous disposons d'un numériseur. Nous pouvons donc commencer l'opération de numérisation. Faux! Avant d'entreprendre la numérisation de collections d'images fixes, il importe de connaître les différents aspects techniques d'une telle opération, car les décisions prises à cette étape sont cruciales à la conservation et à l'utilisation des images. Trois aspects seront ici examinés, soient la technique de numérisation, les formats de fichiers et les supports servant à emmagasiner les données numériques.
Si la qualité de la résolution, c'est-à-dire la quantité de pixels contenus dans une image17, a parfois été sacrifiée par souci d'économie d'espace de stockage18, les récentes avancées technologiques ont permis d'amenuiser ce problème19. Les capacités des supports ont augmenté et les coûts de rangement diminué. Pourtant, de nombreux chercheurs ne préconisent pas automatiquement de recourir à la plus haute résolution possible.
S.E. Ostrow fait ressortir de nombreuses implications au fait d'utiliser la plus haute résolution possible qui se répercutent toutes sur les coûts de l'opération: la numérisation est plus coûteuse, les besoins de stockage demeurent importants, et les postes informatiques permettant la consultation des copies numériques doivent contenir assez de mémoire pour les télécharger dans un délai raisonnable ainsi que comporter un moniteur rendant compte de leur résolution, sans quoi une résolution de haute qualité perd son utilité20. Par conséquent, il propose d'agir selon les types d'usagers de l'institution et leurs besoins21. Une autre considération serait les capacités visuelles de l'être humain. En effet, A.R. Kenney rapporte que bien peu de gens seraient capables, à l'œil nu, de constater les différences entre la copie numérique d'une page de 600 dpi et la version de 1200 dpi22.
S. Tanner et J. Lomax indiquent qu'idéalement les documents devraient être numérisés selon la résolution maximale que le numériseur utilisé peut produire. Reconnaissant toutefois que cet idéal ne peut pas être nécessairement atteint, ils suggèrent une résolution et une profondeur23 minimales pour plusieurs supports24.
----TABLEAU-----
Certes, la résolution dépend du but que s'est donnée l'institution qui projette de numériser ses collections25. Veut-elle simplement donner un plus large accès à ses images ou entend-t-elle les préserver à long terme? S. Puglia identifie deux catégories de résolution: celle qui sert à la reproduction ? pour laquelle nous pouvons utiliser un minimum de 600x400 pixels pour la reproduction sur moniteur et 300 à 600 dpi aux fins d'impression - et celle qui sert à la préservation26. Bien sûr, une conservation à long terme nécessite la plus haute résolution possible afin de s'assurer que toute l'information contenue sur les images soit correctement représentée. Ceci est d'autant plus important dans le cas où les originaux ont perdu leur intelligibilité ? notamment s'ils n'ont guère survécu au temps ? et, de fait, sont devenus totalement inaccessibles. Partant de ces considérations, nous pourrions envisager d'offrir aux usagers une version des images dont la résolution serait limitée mais amplement suffisante pour des besoins courants. Une telle copie, de par sa taille, serait téléchargeable dans un délai relativement rapide. Si les besoins de la recherche exigent une version de qualité, ce qui sans doute serait le lot pour une quantité limitée d'usagers, ces derniers pourraient avoir accès à l'original, lorsque possible, ou à une copie numérique de la plus haute qualité. Ce procédé faciliterait l'accès aux images fixes sur supports numériques tout en limitant les coûts liés à leur numérisation, à leur préservation et à leur consultation.
La question de l'utilisation des originaux ou des duplicata pour fins de numérisation ne fait pas l'unanimité. L'usage des originaux permet, de façon générale, d'obtenir une copie numérique de plus grande qualité. En effet, à chaque génération de copie est introduite une perte de qualité. Ainsi, si nous possédons une image sur négatif, sur microfilm et sur un imprimé photographique, l'expérience de divers projets de numérisation a montré que l'usage du négatif est préférable. Le procédé se révèle moins complexe, notamment au niveau de l'ajustement des couleurs et des tons propres aux images. Les résultats de la numérisation de microfilms, notamment, paraissent à cet égard quelque peu décevants. Un autre argument cité en faveur de l'utilisation des originaux est le gain de temps27. Et un gain de temps représente aussi un gain financier.
Cependant, d'autres facteurs sont aussi à considérer. Par exemple, F. Frey fait valoir que, si le négatif offre généralement une image numérique de plus haute qualité, l'imprimé d'une photographie artistique comporte le travail qui a été effectué par le photographe en chambre noire28. Les deux versions de l'image (négatif et photographie) peuvent donc offrir des différences. Laquelle choisirons-nous alors d'utiliser? Certes, le luxe de choisir ne se présente pas toujours. Mais lorsqu'il est possible d'effectuer un choix, il faut faire preuve de jugement. Si la mission d'une institution est la conservation et la diffusion d'œuvres d'art, l'imprimé produit par l'artiste sera sans aucun doute le choix à effectuer.
Mentionnons aussi que, dans certains cas, l'usage d'une copie a donné des résultats convaincants. Ainsi, les responsables du projet Blake Archive ont opté pour la mise sur transparents de l'image de nombreux papyri ? assurant ainsi leur conservation à long terme ? et ont utilisé ces copies aux fins de la numérisation. Les résultats se sont avérés préférables à ceux obtenus par la numérisation des papyri 29. Il n'y a donc pas de solution unique à la question qui nous intéresse. Chaque projet doit être analysé en fonction de ses particularités et des ressources disponibles.
Devant la multitude des formats de fichiers, il faut opérer un choix. J.-M. Rodes, G. Piejut et E. Plas présentent à cet égard deux recommandations générales qui sont, à notre avis, de la plus haute importance, car elles facilitent de manière importante la gestion et l'utilisation des documents numériques: d'abord, opter pour des formats standards et, deuxièmement, s'en tenir au choix effectué autant que faire se peut30.
Parmi les formats disponibles, nous retrouvons le TIFF (Tagged Image File Format), GIF (Graphics Interchange Format), JPEG (Joint Photographic Expert Group), Flashpixs, ImagePac, PNG (Portable Network Graphics) et PDF (Portable Document Format). Nous nous intéresserons particulièrement aux trois premiers, qui sont les plus couramment utilisés.
Plusieurs critères influencent la sélection d'un format. D'abord, il est hautement préférable d'opter pour un format indépendant, c'est-à-dire dont la lecture n'est pas liée à un environnement particulier. En d'autres mots, aucun système n'étant essentiel, les documents ne sont pas réduits à être consultés sur les seuls appareils répondant aux spécifications requises, ce qui facilite l'accès aux documents. En outre, cela assure la préservation fonctionnelle des fichiers. Ceux-ci demeureront lisibles le plus longtemps possible, malgré les différents ordinateurs utilisés afin de procéder à leur lecture. Les images en format GIF et JPEG sont aisément accessibles. Celles en TIFF peuvent être lues sur des ordinateurs aux systèmes et aux logiciels variés, en plus de bénéficier de la préservation fonctionnelle31.
Idéalement, le format doit permettre la conservation de la résolution des images, la profondeur des bits, la qualité des couleurs et des tons, ainsi que supporter la présence de métadonnées32. Le format le plus apte à répondre à ces critères demeure, jusqu'à maintenant, le format TIFF33. Il est exempt de compression, ce qui est un avantage indéniable. Certes, il demande un plus vaste espace de stockage, mais la qualité des images demeure constante. Il n'en va pas de même avec un format compressé, tel JPEG. Si elle a l'avantage de réduire l'espace de stockage requis et, par conséquent, les frais encourus, la compression s'accompagne d'une irréversible perte de données, donc d'une réduction au niveau de la qualité de l'image34. Une autre option serait d'utiliser les formats de compression qui n'entraînent aucune perte de données (ITU G4 ou JBIG, par exemple). Ceux-ci, moins répandus, se révèlent particulièrement efficaces lorsque employés pour sauvegarder des images en deux tons. Toutefois, l'économie d'espace dans le cas d'images couleurs est nettement moins significative35.
Quel format devons-nous alors privilégier? La littérature sur le sujet nous invite à penser que l'usage des données est le facteur clef dans la prise de décision. Et pourtant, cet usage peut évoluer au fil des ans. Quoiqu'il en soit, les formats sans compression demeurent nettement préférables pour les données destinées à la préservation et à l'archivage. Par contre, pour servir les besoins d'un usage fréquent, il faut envisager les formats compressés. L'équipement informatique, les systèmes d'exploitation et Internet36 supportent plus aisément ces fichiers. Moins lourds, ces derniers se téléchargent beaucoup plus rapidement. Ceci demeure une qualité importante pour les usagers, notamment pour ceux qui ne bénéficient pas de la «toute dernière technologie de pointe». Dans ce contexte, le format JPEG, par exemple, se révèle tout indiqué pour offrir à la clientèle des imagettes (thumbnails) et leurs images correspondantes aux fins d'un usage courant37. Il y a tout lieu de croire, cependant, que la recherche, notamment concernant la technologie de compression, mènera éventuellement à l'utilisation de formats de fichiers davantage performants. À cet égard, il sera intéressant de voir les développements du format PNG sur 24 bits.
Tout comme pour les formats de fichiers, il est recommandé de sélectionner un nombre limité de supports et que ceux-ci soient standards38. Leur homogénéité et leur standardisation facilitent la gestion et l'utilisation des collections d'images numériques.
C. Grout et al. différencient médias portatifs et médias non portatifs. Sont notamment inclus dans la première catégorie les supports à bande magnétique (disquettes, cassette DAT, etc.) et les supports optiques (CD-ROM, DVD, DVT). Dans la seconde, nous retrouvons les disques durs, ceux spécifiques à des ordinateurs précis et ceux appartenant à un réseau39.
Les supports, leurs capacités et leur utilisation sont intimement liés. Ainsi, pour l'archivage, W. Weber et M. Dorr recommandent l'usage des cassettes DAT ou des CD-ROM, deux supports dont la standardisation autorise leur lecture peu importe les systèmes utilisés40. Les DAT ont l'avantage de posséder une capacité supérieure (4 gigaoctets) aux CD-ROM (650 mégaoctets). Par contre, ils sont davantage fragiles ? analogiques, les bandes se détériorent lors de leur consultation ? et la vitesse d'accès à l'information est plus lente41. Les DVD (17 gigaoctets) et les DVT (40 gigaoctets), d'apparition plus récente, ont une capacité nettement supérieure42. Or, ils sont très fragiles. Il est possible de penser que de tels types de supports ? notamment le DVD, dont la diffusion a pris énormément d'ampleur ces dernières années ? seront pourtant davantage envisagés. Notons toutefois que l'amélioration des capacités de stockage de ces supports n'a pas que des avantages. En effet, plus il y a de données contenues sur une seule unité de rangement, plus la perte encourue est grande si ladite unité est endommagée ou volée.
C. Grout et al., quant à eux, proposent que les copies d'archives puissent se trouver sur des médias portatifs ou non portatifs43. Bien qu'il soit incontestablement utile d'avoir sous la main une copie sur le disque d'un serveur, par exemple, il paraît beaucoup plus sécuritaire, dans le cas spécifique des copies d'archives, de ranger dans une voûte, contrôlée et située en lieu sûr, des versions portatives. Ajoutons que si les deux méthodes sont combinées, nous avons l'assurance de ne pas perdre irrévocablement l'ensemble des images numériques dans les cas de destructions ou de vols.
En ce qui concerne les collections d'utilisation courante (c'est-à-dire les copies de diffusion), il serait préférable qu'elles se trouvent en réseau sur le disque du serveur ou sur l'Internet. Ces deux méthodes ont le mérite d'assurer un accès élargi aux documents. L'utilisation de médias portatifs nécessite une copie par utilisateur, ce qui restreint l'accès, et le risque existe qu'elle soit endommagée, perdue ou volée.
Enfin, une méthode intéressante permettant une vaste diffusion est celle du miroir. Celle-ci consiste en l'obtention, par une institution propriétaire de documents numériques, de la collaboration d'autres institutions prêtes à rendre accessible, sur leur propre serveur, une copie de collections d'intérêt particulier pour un vaste public. Ces dernières organisations n'ont pas le mandat ou la responsabilité de conserver les documents à long terme, mais elles servent à assurer un accès lorsque le serveur-maître connaît des difficultés ou un fort achalandage ralentissant le service. Donnons pour exemple le cas du site Perseus (http://www.perseus.tufts.edu/), dont la vocation est de favoriser l'étude de l'Antiquité gréco-romaine par la diffusion d'images, de textes et d'outils linguistiques. Géré et diffusé par le Department of the Classics de la Tufts University (Somerville, MA), il est également disponible via des miroirs situés à Chicago et à Berlin.
Il ne suffit pas de numériser les images. Encore faut-il être capable de les repérer, de les visionner, de les utiliser et de savoir exactement à quoi elles se rapportent. Les métadonnées sont intimement liées à la préservation des documents numériques. Sans elles, leur repérage devient extrêmement complexe, voire impossible, et leur signification est compromise. Plusieurs types de métadonnées existent. Examinons ici le cas des métadonnées descriptives, techniques et celles de nature légale.
Avec justesse, H. Besser écrit : «[...] extensive metadata is our best way of minimizing the risks of a digital object becoming inaccessible»44. En d'autres termes, si elles ne sont pas documentées, les images numériques ne sont guère utiles45. Leur accès et leur utilisation est tributaire de leur description. Par exemple, la consultation de la célèbre photographie de Dorothea Lange intitulée Destitute pea pickers in California. Mother of seven children. Age thirty-two. Nipomo, California. February, 1936 est impossible si celle-ci n'est pas répertoriée par titre, par nom d'auteur, par sujet, etc. Demander à l'usager de patiemment télécharger chacune des photographies de la US Farm Security Administration Collection afin de trouver celle désirée serait impensable!
Dans son article «Metadata for Images: Emerging Practice and Standards», M. Day fait état des éléments descriptifs issus du troisième Dublin Core Workshop (1996). Parmi ceux-ci, comptons le titre, l'auteur ou créateur, les sujets/mots-clefs, un court texte descriptif, l'éditeur, les autres contributeurs, la date, le type de ressources (image, par exemple), la langue, ainsi que la relation avec d'autres documents46. Tous ces éléments servent utilement le repérage des images au sein de la collection. Et ils offrent bien plus. Ils servent à les interpréter adéquatement et, par la suite, facilitent leur utilisation, que ce soit à des fins de recherche scientifique, d'étude, de travail ou de loisir.
Les métadonnées descriptives, aussi intéressantes et importantes soient-elles, ne suffisent pas dans le cas des images numériques. Plusieurs chercheurs se sont penchés sur la nécessité d'attacher à celles-ci des données de nature technique. Le Working Group on Preservation Issues of Metadata du Research Libraries Group a émis d'utiles recommandations dans son rapport de 1998. Ainsi, il a identifié les éléments suivants: la date de création du fichier, l'identification du responsable des métadonnées et celle du responsable de la création du fichier, la marque et le modèle de l'appareil utilisé pour procéder à la numérisation, tous détails relatifs à la numérisation (longueur focale et type de lentille dans le cas d'une caméra numérique, logiciel, etc.), la documentation des changements opérés au niveau du fichier, les caractéristiques du document numérisé (ses dimensions, par exemple), la résolution, le recours (ou non) à la compression du fichier, l'utilisation (ou non) de techniques cryptographiques servant à préserver l'authenticité du document, ainsi que les détails relatifs à la couleur47. À ces éléments, ajoutons le format (TIFF, GIF, etc.).
H. Besser fait valoir à juste titre que certains détails paraissant superflus de nos jours pourraient prendre une importance marquée dans le futur. Il donne l'exemple du profil couleur des numériseurs, donnée qui pourrait permettre de visionner, sur les appareils à venir, des images dont la couleur serait rendue avec justesse48. Il faut donc voir que sans les métadonnées techniques, la consultation des images – dans un avenir peut-être pas tellement éloigné, considérant la rapidité avec laquelle se modifie la technologie – sera compromise. La question de l'imprévisibilité, toutefois, demeure.
Ajoutons que ces données de nature technique ont aussi d'autres applications. Mentionnons qu'elles permettent, jusqu'à un certain degré, d'assurer l'authenticité des documents. Savoir, par exemple, que la numérisation d'une collection d'affiches a été effectuée sous l'égide d'une université et que les données bénéficient d'une méthode de protection cryptographique permet aux utilisateurs de pouvoir se fier davantage aux images consultées. Cet aspect, nous le constatons aisément, demeure primordial, surtout dans un contexte où les logiciels existants permettent de modifier les documents numériques ? notamment les images fixes ? avec la plus grande facilité.
Les métadonnées légales comprennent tous les détails relatifs à la propriété des images, à leurs droits d'utilisation et à leurs droits de reproduction49. Toute restriction à ce niveau se doit d'être indiquée afin de respecter les lois, les politiques de l'institution, ainsi que les droits des individus et le respect de la propriété intellectuelle.
Ces données, afin de servir leur but, doivent être jumelées à un système de contrôle permettant de faire respecter les politiques et autres droits tels que définis par la loi et l'institution responsable de la collection50. Le système pourrait empêché les utilisateurs de modifier les fichiers par exemple. Ou bien, si une image en particulier ne peut pas être reproduite, le système doit faire en sorte qu'elle ne soit ni imprimée, ni copiée. En fait, il s'agit d'utiliser les données légales et de les rendre, par des outils informatiques, applicables. En outre, ces métadonnées servent, au même titre que les données descriptives et celles techniques, à assurer la fidélité et l'authenticité des images numériques.
Il y a quelques années, A. Smith écrivait «much is gained by digitizing, but permanence and authenticity, at this juncture of technological development, are not among those gains.»51 Cette constatation paraît toujours valide.
Les négatifs sur plaque de verre, les imprimés photographiques, les larges cartes sur papier et autres supports qui existent depuis de nombreuses années ont en commun de souffrir de l'usure du temps. Ceci risque bien peu d'être le cas pour les documents numériques. À la vitesse où la technologie évolue, deviendront obsolètes avant de se dégrader.
Certes, de mauvaises conditions de conservation et d'utilisation des supports numériques peuvent entraîner la perte des images fixes sur supports numériques. Toutefois, de nombreux chercheurs indiquent, avec raison, que le problème d'obsolescence des technologies est celui qui représente la plus grande menace à leur préservation52. Les supports d'information changent fréquemment. En l'espace d'une vingtaine d'années environ, les CD inscriptibles ont supplanté les populaires disquettes 3½ po, qui elles-mêmes avaient éclipsé les larges disquettes 8 po. Cela est sans compter la présence des disquettes ZIP. De plus, les logiciels sont nombreux et de nouvelles versions apparaissent périodiquement sur le marché. Les environnements évoluent. Les ordinateurs, aussitôt mis sur le marché, sont déjà dépassés au profit d'appareils plus performants. Les interfaces d'affichage sont elles aussi appelées à évoluer. Or, les caractéristiques d'affichage prennent toute leur importance dans le visionnement d'images. La préservation des documents numériques, dont les nombreuses images fixes, n'est pas, dans ce contexte, une mince tâche.
Le défi que pose l'instabilité technologique a appelé la recherche de solutions. Un premier remède à ce mal consiste en la préservation de la technologie. Il s'agit ici de conserver tout le matériel nécessaire ? lecteurs, logiciels, etc. ? à l'utilisation des différents documents visuels en notre possession. S. Gould et M.-T. Varlamoff, toutefois, font très bien ressortir tous les problèmes que cette solution entraîne: ces équipements, d'abord, sont beaucoup trop nombreux et diversifiés. Par le fait même, il est impossible de les conserver dans leur entièreté. Puis, ils ne pourront pas être réparés, faute de pièces et d'expertise, d'ici quelques décennies. Enfin, à supposer que nous ayons sous la main le matériel nécessaire et qu'il soit opérationnel, qui possèdera les connaissances requises pour utiliser des technologies aussi variées?53 J. Rothenberg, quant à lui, faisait valoir qu'une telle initiative nuirait à l'accessibilité des documents. En effet, peu nombreux seraient les organismes capables de supporter les coûts d'un musée d'ordinateurs et donc d'assurer la diffusion et l'utilisation des fichiers54. Il semble donc que cette solution ne soit pas à privilégier. D'autres choix, toutefois, s'offrent à nous: la migration et l'émulation.
D'abord, la migration est l'«opération au cours de laquelle les bits d'un fichier ou d'un programme sont modifiés afin de pouvoir être lus par un nouveau système d'exploitation ou une nouvelle version d'une application. Il s'agit d'un retraitement des données anciennes visant à les rendre compatibles avec un nouvel environnement»55. Ce procédé, par lequel sont transférés les fichiers d'une technologie menacée d'obsolescence à une technologie plus récente, est celui qui, actuellement, est le plus en usage. J. Rothenberg fait toutefois valoir que la raison de cette «popularité» tient surtout au fait que les procédés alternatifs se font attendre57.
La migration assure une longévité supérieure aux documents numériques. Or, elle n'est pas sans faille. D'abord, elle peut s'avérer extrêmement complexe, surtout si elle met en cause des documents aux propriétés différentes. Cette difficulté s'atténue toutefois si la collection comprend des fichiers aux caractéristiques les plus communes possibles, par exemple un ensemble de photographies couleur en format TIFF, avec une résolution de 300 ppp. Mais des défis demeurent. La conversion entraîne parfois des pertes de données, dues à leur retraitement, ce qui menace l'intégrité des fichiers. Comme de telles pertes peuvent survenir à chaque migration, la qualité du fichier risque de s'amoindrir de génération en génération. Ceci fait en sorte qu'il risque d'y avoir une différence, subtile ou non, entre le document tel qu'il existait à l'origine et la version qui est contemporaine à celui ou celle qui la consulte. La fiabilité dudit document est donc compromise58.
Puis, la haute instabilité de la technologie fait en sorte qu'il est difficile de prévoir le moment où les migrations seront nécessaires. La planification du processus, pourtant importante, s'en trouve compliquée. Mentionnons aussi qu'un manque de vigilance peut entraîner un retard ou une absence de la migration à un moment donné, ce qui se traduira par la perte de documents. Ajoutons que les formats et les supports, notamment, ne changent pas tous au même rythme. Plus ils sont homogènes, plus le processus de migration s'en trouve facilité, ce qui se répercute positivement sur les coûts de l'opération59.
L'opération de migration exige aussi, en plus des investissements liés aux besoins technologiques, un énorme travail. Ceci est d'autant plus vrai que les documents visuels se font de plus en plus nombreux. Dans ce contexte, pouvons-nous penser qu'un transfert automatisé ou semi-automatisé viendrait faciliter et accélérer le processus? J. Rothenberg fait montre d'une grande réticence face à ces possibilités. Trop nombreuses seraient les erreurs et les pertes introduites par de telles méthodes de conversion60. Toutefois, ne sachant pas ce que l'avenir nous réserve du côté de la technologie, il est permis de penser que l'automatisation ou la semi-automatisation pourraient potentiellement faire leurs preuves. La migration apparaît, à plusieurs égards, risquée et coûteuse. Or, d'autres options s'offrent-elles à nous?
L'émulation, quant à elle, est le procédé par lequel «un programme [qui] simul[e] l'environnement informatique nécessaire à l'exploitation des données sur une plate-forme courante alors que leur environnement technique est obsolète.» Ici61, nul besoin de conserver un musée des ordinateurs et des logiciels, puisque l'émulateur se charge d'imiter la technologie disparue afin de procéder à la lecture d'un fichier dans son format original. Par cette technique, il n'est pas nécessaire de modifier le document, comme dans le cas de la migration. Les pertes, de génération en génération, sont donc évitées.
J. Rothenberg indique que l'utilisation du logiciel original «is the only reliable way to recreate a digital document's original functionality, look and feel.»62 Cependant, à la lumière de la littérature sur le sujet, il semble que de sérieux efforts de recherche dans ce domaine devront se poursuivre avant que cette méthode ne soit applicable. O.Y. Rieger fait notamment valoir que l'intégrité et l'authenticité des données ne sont nullement garanties, ce qui est un désavantage majeur63. Qui plus est, l'émulation de technologies anciennes requiert, aux fins de son utilisation, un savoir-faire que ne possèderont pas nécessairement le personnel et la clientèle souhaitant consulter les documents. À ce propos, J. Rothenberg compare la connaissance du fonctionnement de logiciels obsolètes à la capacité de déchiffrer les manuscrits anciens65. Or, cette dernière tâche, très spécialisée, est réservée à une quantité extrêmement limitée de personnes. Si nous voulons que les collections soient accessibles au plus grand nombre de gens possible, nous ne pouvons exiger des utilisateurs qu'ils connaissent effectivement les divers logiciels obsolètes. Ajoutons que l'existence d'émulateurs suppose, comme l'ont si justement fait remarquer J.-M Rodes, G. Piejut et E. Plas, leur propre préservation66. Chaque génération d'émulateur devra être capable d'imiter de plus en plus de logiciels. Or, les émulateurs supporteront-ils un tel poids? Si tel n'est pas le cas, il faut envisager la conservation de différents émulateurs aptes à différentes tâches. Ainsi, J. Rothenberg propose qu'à chaque plate-forme soit créé un émulateur spécifique67.
La numérisation d'images fixes implique la prise en compte de nombreuses considérations qui ne peuvent pas être réglées définitivement. Comme nous l'avons vu, la rapidité avec laquelle se modifie la technologie appelle à la plus grande vigilance de la part des responsables de collections numérisées, qui n'ont guère de choix que d'adopter une approche pro-active. Les collections d'images fixes doivent demeurer accessibles et conserver leur intégrité malgré les changements technologiques. L'évolution technologique rapide fait donc de la préservation des images numériques un processus continu.
Une façon de faciliter ce processus est d'opter, le plus possible, pour des méthodes et des formats standards. Ceci peut se faire au sein d'une institution, mais peut avantageusement être appliqué à un niveau plus large. Mentionnons l'exemple du Groupe des représentants nationaux sur la numérisation du patrimoine scientifique et culturel (GRN), une initiative de l'Union européenne (2001), qui, non seulement prône l'adoption de standards au sein des pays membres, mais travaille aussi sur des sujets tels l'évaluation des pratiques de numérisation et la valorisation du patrimoine68. La coopération, qu'elle soit internationale comme dans le cas du GRN ou effectuée à un niveau plus local entre institutions ayant un mandat similaire, par exemple, paraît un moyen des plus efficaces pour faire face aux défis de la numérisation et de la conservation des documents numériques, images fixes et autres. Adoption de politiques et de standards communs, partage des connaissances, partenariat au sein de groupes de recherche alliant partage des expertises et des coûts, voilà des avantages de la collaboration qui pourraient hautement favoriser la bonne marche des projets de numérisation et la conservation des documents numériques nés de cette opération. Ajoutons qu'un autre avantage indéniable serait l'augmentation de la visibilité des collections, ce qui pourrait se traduire par l'augmentation de leur utilisation. Par exemple, si plusieurs institutions à vocation culturelle et éducative de la région de Montréal et possédant des collections d'images fixes joignaient leurs efforts, les membres ou clientèles de chacune de ces institutions pourraient connaître l'existence de l'ensemble de leurs collections. En somme, la collaboration paraît un moyen tout indiqué de faire face aux nombreux défis de la numérisation, de la consultation et de la conservation à long terme d'images fixes sur supports numériques.
Archives nationales du Québec. Historique et mandat. (Page consultée le 28 septembre 1998), [En ligne]. URL : http://www.anq.gouv.qc.ca/ANQ-C-01.html. retour
Besser, Howard. "Digital Longetivity." In Handbook for Digital Projects: A Management Tool for Preservation and Access, éd. Maxine K. Sitts, 155-166. Andover: Northeast Document Conservation Center, 2000.retour
Burke, Peter. Eyewitnessing: The Uses of Images as Historical Evidence. Ithaca: Cornell University Press.retour
Conway, Paul. "Overview: Rationale for Digitization and Preservation." In Handbook for Digital Projects: A Management Tool for Preservation and Access, éd. Maxine K. Sitts, 5-20. Andover: Northeast Document Conservation Center, 2000.retour
Day, Michael. "Metadata for Images: Emerging Practice and Standards." In The Challenge of Image Retrieval: CIR 99 - Second UK Conference on Image Retrieval, 25-26 February 1999, Newcastle upon Tyne, 1999. http://www.ukoln.ac.uk/metadata/presentations/cir99/paper.html (Page consultée le 18/01/2005).retour
De Stephano, Paula. "Selection for Digital Conversion." In Moving Theory into Practice: Digital Imaging for Libraries and Archives, éd. Anne R. Kenney et Oya Y. Rieger, 11-23. Mountain View, CA: Research Libraries Group, 2000.retour
Frey, Franziska. 2000. "Developing Best Practices: Guidelines from Case Studies. 2. Working with Photographs." In Handbook for Digital Projects: A Management Tool for Preservation and Access, éd. Maxine K. Sitts, 111-119. Andover: Northeast Document Conservation Center, 2000.retour
Gould, Sara et Marie-Thérèse Varlamoff. "The Preservation of Digitized Collections: Recent Progress and Persistent Challenges World-Wide." In A Reader in Preservation and Conservation, éd. Ralph W. Manning et Virginie Kremp, 1-12. München: K.G. Saur, 2000.retour
Graham, Peter S. "Building the Digital Research Library: Preservation and Access at the Heart of Scholarship." In Follett Lecture Series. Leicester University, March 19, 1997. http://ukoln.bath.ac.uk/services/papers/follett/graham/paper.html (Page consulté le 22/02/2005).retour
Greenan, Monica. "DSpace", DigiCULT.Info: A Newsletter on Digital Culture, no. 3, p. 8 (2003). http://www.digicult.info/downloads/digicult_info1_newsletter.pdf (Page consultée le 01/02/2005).retour
Grout, Catherine, Phill Purdy, Janine Rymer, Karla Youngs, Jane Williams, Alan Lock et Dan Brickley. Creating Digital Resources for the Visual Arts: Standards and Good Practice. Oxford: Oxbow Books, 2003.retour
Hodge, Gail M. "Best Practices for Digital Archiving: An Information Life Cycle Approach", D-Lib Magazine, 6, no. 1 (2000). http://www.dlib.org/dlib/january00/01hodge.html (Page consultée le 18/01/2005).retour
Kenney, Anne R. "Digital Benchmarking for Conversion and Access." In Moving Theory into Practice: Digital Imaging for Libraries and Archives, éd. Anne R. Kenney et Oya Y. Rieger, 24-60. Mountain View, CA: Research Libraries Group, 2000.retour
Lagoze, Carl et Sandra Payette. "Metadata: Principles, Practices, and Challenges." In Moving Theory into Practice: Digital Imaging for Libraries and Archives, éd. Anne R. Kenney et Oya Y. Rieger, 84-100. Mountain View, CA: Research Libraries Group, 2000.retour
Lazinger, Susan S. Digital Preservation and Metadata: History, Theory, Practice, Englewood, CO: Libraries Unlimited, 2001.retour
Nichols, Stephen G. et Abby Smith. The Evidence in Hands: Report of the Task Force on the Artifact in Library Collections, Washington D.C.: Council on Library and Information Resources, 2001.retour
Ostrow, Stephen E. Digitizing Historical Pictorial Collections for the Internet, 1998. http://www.clir.org/pubs/reports/ostrow/pub71.html (Page consultée le 18/01/2005).retour
Pavão, Luis. "The Photographic Archives of the City Hall in Lisbon." In A Reader in Preservation and Conservation, éd. Ralph W. Manning et Virginie Kremp, 141-144. München: K.G. Saur, 2000. [publication originale dans l'International Preservation News, 17 (Mai 1998)].retour
Puglia, Steven. "Technical Primer." In Handbook for Digital Projects: A Management Tool for Preservation and Access, éd. Maxine K. Sitts, 83-102. Andover: Northeast Document Conservation Center, 2000.retour
Rieger, Oya. Y. "Projects to Programs: Developing a Digital Preservation Policy." In Moving Theory into Practice: Digital Imaging for Libraries and Archives, éd. Anne R. Kenney et Oya Y. Rieger, 135-152. Mountain View, CA: Research Libraries Group, 2000.retour
Rodes, Jean-Michel, Geneviève Piejut et Emmanuèle Plas. La mémoire de la société de l'information. Paris: UNESCO, 2003.retour
Rothenberg, Jeff. Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation. Washington D.C.: Council on Library and Information Resources, 1999.retour
Rothenberg, Jeff. Long-Term Preservation of Digital Information: Challenges and Possible Technical Solutions, 2000. http://www.kb.nl/coop/nedlib/workshop/rothenberg_kb.pdf (Page consultée le 18/01/2005).retour
Smith, Abby. Why Digitize? Washington D.C.: Council on Library and Information Resources, 1999.retour
Tanner, Simon et Joanne Lomax. "Future Technologies for Preserving the Past: Creating Digital Image Collection Content." In Paper for the Scanning and Recognition Technology for Digital Document Management and Electronic Publishing Conference, 24 June 1999 at the Fielder Centre, University of Hertfordshire, 1999. http://heds.herts.ac.uk/resources/papers/rectech99.pdf (Page consultée le 18/01/2005).retour
Vogt-O'Connor, Diane. "Selection of Materials for Scanning." In Handbook for Digital Projects: A Management Tool for Preservation and Access, éd. Maxine K. Sitts, 35-63. Andover: Northeast Document Conservation Center, 2000.retour
Weber, Hartmut et Marianne Dorr. Digitization as a Mean of Preservation?, trad. Andrew Medlicott, Amsterdam: European Commission of Preservation and Access, 1997. http://www.clir.org/pubs/reports/digpres/digpres.html (Page consultée le 18/01/2005
EBSI > Cursus > Vol 5 no 1 > ###NOM DE FAMILLE DE L'AUTEUR DE L'ARTICLE | Dernière mise à jour : 29 mars 2000 |