Survol du monde de l'indexation des images

par

Kumiko Vézina


Cursus vol. 4 no 1 (Automne 1998)

Cursus est le périodique électronique étudiant de l'École de bibliothéconomie et des sciences de l'information (EBSI) de l'Université de Montréal. Ce périodique diffuse des textes produits dans le cadre des cours de l'EBSI.

ISSN 1201-7302

C. élec. : cursus@ere.umontreal.ca
URL : http://www.fas.umontreal.ca/ebsi/cursus/

Droits d'auteur

Tout texte demeure la propriété de son auteur. La reproduction de ce texte est permise pour une utilisation individuelle. Tout usage commercial nécessite une permission écrite de l'auteur.


L'auteure

Ayant terminé sa maîtrise à l'EBSI en juillet 1995 avec un stage à New York, elle fait partie de la première vague d'étudiants au Doctorat en sciences de l'information à l'EBSI dès septembre de la même année. Ses intérêts portent principalement sur les systèmes d'indexation d'images fixes ainsi que les besoins d'usagers de collections visuelles.

Pour joindre l'auteur : vezinak@ere.umontreal.ca



Table des matières


Résumé

Le domaine de l'indexation des images est encore relativement jeune si on le compare à celui de l'indexation textuelle mais il est en pleine effervescence. À partir de la fin des années 70, de nombreuses institutions voulurent mettre en valeur leurs collections visuelles. Ils mirent donc sur pied des projets de thésaurus et de classification de grande envergure destinés à mieux organiser leurs images. Toutefois, ces projets soulevèrent de nombreux problèmes vis-à-vis l'indexation du matériel visuel et moussèrent l'intérêt académique dans le domaine de la bibliothéconomie et des sciences de l'information. Ce survol présente donc les premiers grands projets d'organisation d'images, les systèmes actuels d'indexation des images utilisant de nouvelles techniques comme thésaurus visuels et langages de description pictorielle, les problèmes reliés à ce domaine et les recherches à faire.

Introduction

Au temps de la préhistoire une des premières formes de communication étaient les manifestations soit gravées soit peinturées sur les parois de grottes. À prime abord abstraites, i.e. non-figuratives, ces manifestations ont pris la forme de représentations animales ou végétales. De nombreux exemples ont été détectés en Europe dont les plus connus sont sûrement la grotte de Lascaux en France et celle d'Altamira en Espagne. Ailleurs dans le monde, les aborigènes d'Australie sculptaient des formes animales et végétales afin, entre autres, de délimiter leur territoire, d'indiquer les endroits propices à la chasse ou encore les utilisaient comme points de repère pour se diriger dans la brousse.

À mesure que l'Homme évoluait, les nombreuses civilisations de part le monde développèrent des systèmes de communication plus sophistiqués grâce à des symboles qu'ils inventaient. Dans certaines cultures, l'écriture avait des racines dans le visuel (pictogrammes, idéogrammes, etc.) alors que d'autres développèrent des symboles arbitraires comme l'alphabet hébreu. Jusqu'à nos jours, le texte était à la base de l'éducation et de l'échange d'information.

Maintenant, en grande partie due aux avancements technologiques, nous entrons dans une nouvelle ère où les images deviennent prépondérantes. Les images animées ou en mouvement sont générées en très grande quantité et à une vitesse fulgurante à la fois par la télévision mais aussi, cependant en moins grand nombre, par la création de films. De plus, la production de processus commerciaux, industriels et scientifiques qui génèrent des témoignages visuels d'opérations continuelles comme la banque de données d'images de satellites de la NASA dépasse déjà les téra-octets d'espace-disque sans qu'il ne semble y avoir de relâche. Les images fixes, quant à elles, créées par le monde de l'édition, sont produites à une échelle bien plus réduite et les images de représentations artistiques encore beaucoup moins. Il en découle qu'au niveau de l'organisation, le stockage et le repérage d'images fixes, des progrès ont pu être effectués alors que dans le domaine des images animées, la situation est tout autre.  En effet, l'expérience encore toute jeune des spécialistes de l'information dans le domaine de l'image animée jumelée au fait que ce type d'information augmente de façon exponentielle explique le manque de systèmes adéquats (Enser, 1995).

Un survol du monde de l'indexation des images permettra de voir les grands projets d'indexation d'images, les problèmes reliés à ce domaine ainsi que les recherches à faire.
 

1. Premiers grands projets d'organisation d'images

En Amérique du Nord, vers la fin des années 70 et le début des années 80, un effort se faisait sentir au niveau de la construction de thésaurus et de liste d'autorité pour classifier les images visuelles (Sunderland, 1982). Thomas Ohlgren (1982), spécialiste d'iconographie aux États-Unis, nous fait part de quatre projets inter-institutionnels qui s'adressent aux besoins thématiques du grand public en donnant accès à leurs collections visuelles :
 

1.1 Image Access Society of North America

Société fondée en août 1979 par des archivistes, conservateurs, historiens d'art, muséologues, bibliothécaires de diapositives et de photographies et des spécialistes de l'information lors du premier International Conference on Computers and the Humanities, au Collège de Dartmouth à Hanover au New Hampshire. L'association a profité de l'événement  pour définir ses buts :

a) Recueillir les schémas de classifications en utilisation et faire une compilation de ce
matériel ;
b) Établir une nomenclature pour décrire et évaluer les nombreux schèmes iconographiques ;
c) Recueillir de l'information portant sur les différentes approches à l'accès par sujet en Amérique du Nord auprès des membres de la Société en question ;
d) Commanditer et encourager des projets pilotes dans les domaines de construction de Thésaurus et d'indexation par sujet ;
e) Organiser une conférence pour discuter de la réalisation des buts mentionnés.

Une deuxième rencontre en août 1980 permet à l'association de se poser une question cruciale puis de tenter d'y trouver une réponse : Quels seraient les standards minimaux pour un système pratique d'accès par sujet ? Voici les conclusions qui ont été tirées de cette réunion.

1.2. List of Subject Headings pour la Library of Congress Prints and Photographs Division

Elisabeth W. Betz, spécialiste en catalogage, a complété au début des années 80 une liste alphabétique de 3500 vedettes-matières avec références dont le but est d'améliorer l'accès-sujet aux 10 millions de gravures et de photographies de cette division. Les 65 000 notices de l'index-sujet de cette division furent comparées avec les vedettes-matières au Library of Congress Subject Headings et ont été modifiées pour s'appliquer à des images visuelles.

1.3. Thésaurus de la Division de l'iconographie (Archives publiques du Canada)

Il s'agit de la création d'un thésaurus informatisé de termes iconographiques vers la fin des années 70. Cette entreprise était menée par Raymond Vézina et Douglas Schoenherr avec la collaboration de Denis Castonguay. L'approche scientifique de cette opération fait en sorte qu'il s'agit d'un des projets d'indexation-sujet les plus importants au monde (Ohlgren, 1982). Le thésaurus a fourni un vocabulaire contrôlé d'indexation pour les indexeurs de quelque 150 musées canadiens fédéraux, provinciaux et municipaux (Vézina, 1998). En plus, l'inventaire informatisé a permis une consultation en-ligne à environ 100 000 œuvres d'art de la Division de l'iconographie, un des plus grands dépositaires d'iconographie récente canadienne au Canada regroupant notamment des aquarelles, des gravures, des eaux-fortes ainsi que des toiles. Voici les grandes catégories de leur thésaurus : architecture, costume, activités, artefacts, flore, faune, insignes, paysages, gens et transport. Ce système de classification est constitué d'un vocabulaire structuré utilisant trois niveaux de spécificités :

  1. Liste contrôlée de catégories générales de classification (celles déjà mentionnées) ;
  2. Liste contrôlée de termes de classification consistant en des subdivisions bien définies des catégories générales. Par exemple, pour la catégorie générale " architecture ", une des subdivisions est " architecture domestique " ;
  3. Une liste ouverte où l'on peut ajouter des termes d'indexation spécifiques (ces termes ont des références vers des termes génériques, spécifiques ou associés). Encore une fois, si l'on reprend l'exemple de la catégorie générale" architecture " et de sa subdivision " architecture domestique ", la liste ouverte de termes spécifiques comporterait les termes suivants, entre autres, " fermes ", " maisons historiques ", " igloos ", " wigwams", etc.

1.4. Art and Architecture Thesaurus (AAT)

En 1979, Pat Molholt, Toni Petersen et Dora Crouch annoncent le projet d'un thésaurus dans le domaine de l'architecture qui sera à la fois une liste d'autorité pour la sélection des descripteurs par les indexeurs ainsi qu'un guide pointant vers l'information ou les objets les plus importants pour les besoins des usagers. Ce thésaurus est en fait une liste de termes organisés de façon hiérarchique : attributs physiques, styles et périodes, agents, activités, matériaux et objets. Nous savons maintenant que le résultat final de ce projet a été publié en 1990 et qu'il y a déjà un bon nombre d'articles qui ont été écrit sur ce thésaurus. En effet, le Art and Architecture Thesaurus a été décrit, critiqué et même comparé à d'autres systèmes d'indexation comme ICONCLASS.
 
On peut également mentionner d'autres projets d'organisation de collections visuelles comme celui de Eleanor Fink qui a développé des vedettes-matières pour le Musée d'Art américain du Smithsonian et celui de Elizabeth Glass qui a développé son système de classification par sujet pour le Musée Victoria and Albert à Londres.
 

2. Systèmes d'indexation des images

En ce moment, il existe plusieurs systèmes dont le but est d'indexer des images afin de les stocker pour un jour être en mesure de les repérer. Alors que chaque système adopte une approche différente, ils tendent tous vers un même objectif, i.e. faire en sorte que l'indexation soit la meilleure possible afin que le repérage soit des plus facile et efficace. Voici la description de plusieurs projets en cours de nos jours mentionnés dans un article de Graeme Baxter et Douglas Anderson (1995).

2.1. Méthodes d'indexation basées sur thésaurus ou système de classification

Les méthodes d'indexation basées sur thésaurus ou système de classification utilisent du texte pour décrire les images. Les thésaurus sont des listes hiérarchiques de termes, en général par ordre alphabétique, avec pour chacun des termes des renvois vers des termes plus génériques, plus spécifiques ou des termes associés. Quant aux systèmes de classification, ce sont de grandes catégories qui permettent de faire des regroupements thématiques.

Déjà mentionné, le projet Art and Architecture Thesaurus (AAT), publié en 1990 et se basant sur la structure des vedettes-matières médicales de la National Library of Medicine, est un thésaurus de plus de 50 000 termes (Petersen, 1990). Toutefois, il semblerait qu'un indexeur, même à la suite d'une formation, prend en moyenne quarante minutes pour indexer une diapositive à l'aide de ce système (Keefe, 1990).

Un autre mode de classification, ICONCLASS, représente 17 volumes de codes arrangés de façon hiérarchique associés à des descriptions textuelles. Il semblerait que ce système est très satisfaisant pour décrire de l'iconographie traditionnelle en histoire de l'art (peintures, sculptures, etc.) mais peu satisfaisant pour les objets communs comme meubles, bijoux, et autres. De plus, le processus d'indexation doit être effectué par des spécialistes en histoire de l'art et demeure une opération demandant en moyenne trente minutes par item (Sherman, 1987).

Mis de côté de nos jours semble-t-il, le système de classification TELCLASS a été créé pour le BBC-TV en 1979 pour indexer leur matériel d'images en mouvement. Les codes alphanumériques ainsi que les termes associés utilisés sont regroupés sous six grandes catégories : verbal, schématique, actualité, simulation, technique et formel (Evans, 1987). TELCLASS fut aussi adopté par d'autres institutions notamment par la maison d'édition McGraw-Hill pour leur encyclopédie multimédia portant sur la biologie des mammifères (Baxter et Anderson, 1995). Mais depuis, aucune littérature ne porte sur ce système.

2.2. Thésaurus visuels et systèmes hybrides associés

Une nouvelle vague de recherche explore en ce moment la création de systèmes pour lesquels le texte ne servira plus à indexer ou à repérer les images mais sera remplacé par des éléments visuels. Toutefois, les expériences jusqu'ici utilisent toujours des mots. Ces systèmes se basent sur le concept du " browsing " qui utilise le processus de sélection le plus performant qui soit, i.e. la combinaison de l'œil et du cerveau. Ces nouveaux systèmes sont efficaces pour de petites collections où les images sont relativement simples. Pour une plus grande collection, il faudrait que l'indexation soit assez exhaustive pour que le taux de rappel ne soit pas trop élevé.

Il existe un projet à la NASA au Johnson Space Centre où des images concernant l'espace sont regroupées dans une banque de données qui ne fonctionne pas par logique booléenne mais plutôt à l'aide d'algorithmes se basant sur des statistiques. Le processus de repérage affiche ainsi les données par ordre d'importance par rapport à la requête de l'usager. De plus, le repérage affiche à la fois le terme du thésaurus choisi par l'usager avec les images qui l'accompagne avec en plus les termes génériques, spécifiques et associés avec leurs images liées respectives, tout ceci par ordre d'importance (Seloff, 1990).

À l'Université de Syracuse, un autre projet se dédie à l'identification de feuilles de plantes mais pourrait éventuellement être utilisé pour identifier des fossiles, des os, de la monnaie, etc. Il s'agit de choisir à l'écran, parmi les exemples présentés, une forme similaire à celle de la feuille que le chercheur veut identifier. Par la suite, le chercheur peut manipuler la forme grâce à des " points de contrôle " pour qu'elle corresponde le plus exactement à ce qu'il recherche. Le système retrouvera ensuite, dans la banque d'images, celles qui ressemblent le plus à la feuille à identifier. Ici, l'utilisation de mots pour effectuer une recherche a été complètement mis de côté (Hogan et al., 1991).

Au Danemark, le Riso National Laboratory a créé une base de données, The Book House, qui permet aux usagers de repérer des livres grâce à des icônes (Pejterson, 1993). Par exemple, l'icône du crime représente un homme non-rasé qui se trouve derrière des barreaux. Chacun des icônes est relié à des termes provenant d'un index permettant ainsi à l'usager de construire une requête complexe à mesure qu'il choisi des icônes. Par la suite, la base de données sera en mesure d'identifier une série de livres correspondant aux besoins de l'usager. Il est intéressant de noter que pour déterminer l'image des icônes, il a fallu effectuer une analyse cognitive des besoins et des requêtes des usagers potentiels. De plus, ils se sont rendus compte que la perception et la compréhension d'images étaient bien différentes d'un adulte à un enfant ce qui les a amenés à créer deux séries d'icônes, une pour adultes et l'autre pour enfants, pour des sujets identiques. Il serait intéressant de voir l'efficacité d'un tel système pour le repérage d'images.

À l'Université de Californie à Berkeley, le système qui utilise le logiciel IMAGEQUERY permet aux usagers d'effectuer en premier lieu une recherche textuelle. Le système affiche par la suite une mosaïque d'imagettes que l'usager peut regarder pour ensuite choisir celles qui concorderaient le plus avec ses besoins. Il s'agit d'un modèle hybride qui tente de s'éloigner de l'indexation textuelle des images en utilisant à la fois du texte et du visuel pour effectuer le repérage du matériel visuel (Besser, 1990).
 

2.3. Langages de description pictorielle

Ces systèmes utilisent un langage spécial (algorithmes en général) où la description de l'image peut être codée et lue par une machine. De telles techniques demandent un indexeur très spécialisé et ne sont efficaces que dans le cas de petites collections regroupant des images simples (Baxter et Anderson, 1995). Voici trois exemples de systèmes de description pictorielle.

Le chercheur Leung et ses associés ont établi une méthode qui se base en fait sur la narratologie de l'image pour la décrire. Le projet Entité-Attribut-Relation utilise des " phrases " avec nom, adjectif et verbe pour décrire ce qui se passe sur l'image. Par exemple, une requête pourrait ressembler à : assis, (chat noir, chaise) (Leung et al., 1992).

Un groupe de chercheurs-physiciens à Milan provenant d'institutions telles que le CNR-SIAM et l'Université de Milan, se sont penchés sur la description de la silhouette d'une image grâce aux coordonnées de points spécifiques. Le code ainsi créé ressemblerait à ceci : " ARM FROM (9,19) TO (9,23) WITH ENDPOINT IN (3,25) ". Jusqu'ici, le prototype a servi à décrire des images d'ellipses en astronomie (Bordogna et al., 1990).

À Taiwan, des chercheurs ont développé des chaînes de caractères qui décrivent la relation spatiale entre les différents objets dans une image (Chang et Wu, 1992). En guise d'exemple : T =  *(A,B,7), (B,C,8), (C,D,1), (D,E,4)} où 1 = nord de l'objet de référence, 7 = est de l'objet de référence, 8 = nord-est de l'objet de référence et où A, B, C et D sont des objets.
 

2.4. L'indexation et repérage d'images par contenu

Ces méthodes ne se basent par sur de la description textuelle mais analysent plutôt le contenu d'une image, en se basant sur des analyses mathématiques de déploiements de pixels, pour ensuite les jumeler à la requête de l'usager. La requête en question peut avoir deux formes, soit l'usager choisi une image avec une structure semblable à ce qu'il recherche ou une question décrivant la structure de l'image voulue (" pattern-matching "). Ces systèmes ne sont valides que pour des collections où les images sont simples. Pour le moment, le contenu devra encore être indexé avec des mots (Cawkell, 1992).

En 1987 à l'Université de Victoria en Colombie-Britannique, deux chercheurs ont développé une méthode probabiliste de question-réponse entre ordinateur et usager pour créer un appariement de traits caractéristiques des  images voulues.  Donc à mesure que l'usager répond aux questions posées par l'ordinateur, ce dernier accumule les paramètres qui lui permettront de restreindre la quantité d'images qu'il va retourner à l'usager. Même si ce système très intéressant et convivial a beaucoup plu aux usagers, il ne semble pas y avoir eu de suite à ce projet (Lee et MacGregor, 1987).

Au Royaume-Uni, deux projets se sont démarqués. Celui de Rickman et Stonham à l'Université de Brunel est une base de données faciales avec 500 visages qui utilise un processus de " pattern-matching ", i.e. reconnaissance de formes (Cawkell, 1992) et le projet Shape Analysis For Automatic Retrieval of Images (SAFARI), développé par Eakins à l'Université de Northumbria au milieu des années 80, qui est un système de commandes qui indiquent les coordonnées, la direction, la longueur, l'arc d'un angle et bien d'autres aspects de formes se trouvant dans une image afin de construire une requête de la forme recherchée (Eakins, 1993).

Finalement, le système semi-automatique Query By Image Content (QBIC) conçu par Niblack et associés, pour le groupe de recherche IBM, prend en considération les couleurs, textures et formes d'une image qu'il transforme en formules algébriques. Lors d'une recherche, ce système permet de réduire le taux de rappel dans une grande base de données pour que l'usager puisse ensuite effectuer du " browsing " (Niblack et al., 1993).

3. Problèmes liés à l'indexation des images

À prime abord, il serait important de faire la différence entre les notions de catalogage, classification et indexation. Le problème fut posé à Michèle Hudon, professeur à l'École de bibliothéconomie et des sciences de l'information de l'Université de Montréal, qui à l'aide d'exemples réussit à résumer l'essentiel de ces opérations (Hudon, 1998).

Le catalogage consiste à décrire physiquement un document, quel que soit son format, permettant d'une part de l'identifier de façon unique et d'autre part de le repérer par le biais d'une caractéristique qui n'a pas rapport à son contenu (numéro ISBN, nom de l'auteur, etc.).

La classification permet de placer un document, après en avoir analysé le contenu de façon générale, dans l'ensemble des documents qui traitent du même sujet. Le document est ici considéré comme une entité. C'est un peu comme placer le document dans une boîte étiquetée: Animaux, Meubles, Romans français du 19ème siècle, etc.

Quant à l'indexation, on ne considère plus le document comme une entité distincte mais on considère plutôt les éléments d'information qui s'y trouvent. Le but de l'indexation est toujours de créer des regroupements de documents sur un même sujet, mais la description est plus précise. L'indexation nous permettra donc d'accéder par exemple à tous les documents qui fournissent de l'information sur la meilleure alimentation pour les chiens de telle ou telle race, peu importe que le document qui contient cette information ait été classé dans la grande classe Animaux, sous-classe Chiens, ou dans une classe qui serait plutôt du côté Alimentation, Médecine vétérinaire, etc.

3.1. Indexation trop spécialisée

Karen Markey Drabenstott (1986, 1988) s'est penchée sur l'indexation faite au sein des collections d'images en art. La compréhension des images en histoire de l'art se base, en partie, sur les trois distinctions proposées par l'historien d'art Erwin Panofsky qui sont : description pré-iconographique (sujet primaire : dénotation), l'analyse iconographique (sujet secondaire : connotation) et l'interprétation iconographique ou l'iconologie (sujet tertiaire : symbolisme).  Selon Markey, les collections d'images en art sont presque toujours organisées pour des gens qui possèdent des connaissances en Histoire de l'art où l'emphase est placé sur l'aspect iconographique de l'image, i.e. le sujet secondaire sans aucune mention de l'aspect pré-iconographique, i.e. le sujet primaire.

John Sunderland (1982) mentionne aussi que l'indexeur de collections d'images, dans le domaine de l'analyse du sujet et de l'iconographie, fait face à des problèmes historiques, pratiques et théoriques. Les collections d'images n'ont pas de systèmes d'organisation universellement acceptés. Donc, à cause de leur organisation, la recherche dans de telles collections est presque exclusivement réservée à des personnes versées dans la lecture d'iconographie. Mais de plus en plus, des gens de divers domaines consultent maintenant ces collections (sociologues, musiciens, publicistes, designers graphique, etc.) pour trouver ce dont ils ont besoin soit pour une annonce publicitaire ou une jaquette de livre par exemple. Le problème majeur réside dans le fait que ces nouveaux usagers, qui n'ont pas nécessairement de connaissances dans le domaine de l'iconographie, ne peuvent facilement consulter ces collections avec les systèmes actuels de repérage des images en art. L'accès de ce genre de collections est donc limité. Bref, Markey (1986, 1988) et Sunderland (1982) s'entendent sur le fait qu'il faut tenir compte des besoins de l'usager. La question demeure comment peut-on organiser la collection pour satisfaire tout le monde?

3.2. Polysémie de l'image

Un autre problème réside dans la polysémie de l'image. Ginette Bléry (1981) donne un exemple (voir figure 1) d'une photographie où l'on voit un petit garçon souriant et une petite fille se donnant un baiser alors qu'une deuxième petite fille se trouvant assise de l'autre côté du même garçon arbore une expression furieuse. Sur la même photographie, on retrouve donc, entre autres, les concepts d'amour, de joie, de jalousie, de fureur et même de trahison! Ceci rappelle une phrase de Sara Shatford Layne (1986) : " the delight and frustration of pictorial ressources is that a picture can mean different things to different people ". En effet, selon Sunderland (1982), un des grands problèmes de l'image est qu'elle peut avoir une infinité de significations. Il a donc mené une petite enquête où il a demandé à un enfant de 12 ans, à un profane et à un historien d'art de décrire une image spécifique de J.-E. Millais " Le Christ dans la maison de ses parents " (voir figure 2). La preuve quant à la polysémie de l'image selon le récepteur a été faite; chacune de ses personnes a donné, pour la même image, une interprétation bien différente l'un de l'autre :

Figure 1
Bléry, Ginette. 1981. La mémoire photographique, étude de la classification des images et analyse de leur contenu grâce à l'aide de l'informatique. Interphotothèque, no 41. p. 17.

Figure 2
Sir John Everett Millais (1829-1896). " Christ in the House of His Parents ", 1850
.

3.3. Choix des termes

Selon Michael Krause (1988), un des grands problèmes porte sur le choix des termes pour l'indexation des images. En effet, comment trouver sous quelles vedettes sera placée l'image? La difficulté ne consiste pas à choisir le système d'indexation pour organiser les images mais plutôt de son application, i.e. comment définir les sujets et quels aspects de l'item ou du sujet devraient être mentionnés et les termes même qu'il faudrait choisir. Il explique qu'il existe deux types d'indexation, le " hard indexing " ou le " ofness " d'une image (l'image est de …), i.e. ce que l'indexeur voit dans l'image, soit un chat ou une femme par exemple. Et le " soft indexing " ou le " aboutness " d'une image (l'image est à propos de …) qui porte sur la signification; donc la femme sur l'image est en fait la Muse. C'est à ce niveau que les réactions personnelles et les émotions stimulées par l'image peuvent être relevées. Justement, toujours selon Krause (1988), les bibliothèques devraient donner un accès aux usagers à des idées abstraites comme la faim.  Le fait d'indexer la signification des images améliore l'accès et la valeur donnés à la collection. Les usagers n'auraient pas à chercher à plusieurs endroits, à l'aveuglette, pour trouver ce dont ils ont besoin. Les indexeurs devraient se pencher plus sur la signification des images et sur les différentes utilisations qu'on pourrait faire d'une image pour mieux l'indexer. Ceci permettra à l'usager de trouver beaucoup plus rapidement ce dont il a besoin avec une plus grande efficacité puisque ces images auront été indexées avec des termes qui correspondent mieux à leur besoin. Mais Krause (1988) note que ce n'est pas le cas, les indexeurs ne veulent pas aborder la signification de l'image de peur de devenir subjectif au moment de l'indexation.

Ginette Bléry (1981) pense aussi qu'il faudrait aborder cette question de la subjectivité de l'image. Elle a effectué une expérience où elle a demandé à des personnes (elle ne mentionne pas le nombre de participants) d'indiquer à l'aide de mots abstraits leurs impressions pour chacune des images qu'on leur montre (ni la quantité ni le genre d'image n'étaient indiqués). Des 438 réponses obtenues, elle a pu tirer quatorze couples d'opposition. Selon Bléry (1981), il n'y a pas une infinité de possibilités de significations pour les images et il suffit d'identifier les émotions que peut susciter une image parce qu'en général elle est la même pour tout le monde. Toutefois, il faudrait répéter l'expérience de façon plus scientifique avec un plus grand nombre de participants et d'images. Voici donc les quatorze couples d'opposition en question qui pourraient servir à décrire l'aspect subjectif d'une image :

3.4. Constance de l'indexation

Karen Markey Drabenstott (1984) aurait découvert qu'il y avait une faible constance entre indexeurs lors d'une de ses expériences. Et James Turner (1994) s'est rendu compte que le terme le plus populaire était le même pour environ 60% des participants. Il en découle que la constance inter-indexeur sera plus forte pour le sujet principal et les aspects objectifs que pour les sujets secondaires ou les aspects subjectifs d'une image. Par ailleurs, Sara Shatford (1994) mentionne dans un article plusieurs auteurs ayant étudié la constance de l'indexation.

3.5. Les besoins des usagers

Kevin Roddy (1991), quant à lui, relève que même si les images sont emmagasinées de façon intelligente, elles restent inaccessibles étant donné qu'elles possèdent trop peu de descripteurs. Et le problème des descripteurs est qu'ils sont ambigus, arbitraires et portent à confusion ou à des désaccords. Il indique qu'il serait important que le système indique des valeurs aux items repérés par degré de rapprochement avec la requête. De plus, le plus grand problème de l'accès aux images est l'impossibilité de fournir de l'information sur ce qui serait une session typique de recherche d'information. Il faudrait pouvoir anticiper les besoins du chercheur et il est rare, par exemple, que quelqu'un veuille tout genre de maisons ou d'églises. L'usager habituellement veut un certain genre de maison en particulier.

Dans son mémoire, Murray (1984) mentionne un article de Schroeder qui indique que le problème majeur pour l'indexation d'une collection est l'utilisation future des images. Selon lui, il est impossible d'anticiper les besoins des usagers parce qu'on ne peut jamais savoir ce qui va servir dans une image. Comment faire si un usager veut savoir à partir de quand les femmes commencent à se croiser les jambes? Quand les hommes ont commencé à poser avec des sourires? Quand est-ce qu'on a commencé à montrer les dents en souriant? Ce genre d'information ne fait pas partie des sujets primaires qui seront indexés. Voici d'autres exemples d'éléments qui pourraient être considérés de l'information par des usagers mais qui n'aura pas été tenu en considération lors de la création de l'image et qui ne sont donc pas indexés :

À l'opposé, Wright qui a écrit un des chapitres du livre Picture Librarianship (écrit par Helen Harrison en 1981) considère qu'il y a très peu d'information dans les images et que l'utilisation n'est pas importante lors du processus d'indexation. La seule chose indexable sont les objets (Murray, 1984).

3.6. Transfert de la signification

Un autre grave problème dans le domaine de l'indexation des images est le transfert de la signification d'un médium visuel vers du verbal. On croit en effet que ce transfert cause la perte d'une partie de l'information (Murray, 1984). Surtout lorsque l'œuvre d'art ne contient pas d'information comme titre, attribution, description, etc. En effet, Sunderland (1982) explique qu'il y a des images où l'on ne sait pas de quoi il s'agit à moins que le créateur ne l'ait indiqué. À la figure 3, cette image pourrait aussi bien représenter une famille partant en pique-nique un dimanche qu'une famille de récents immigrés en Alberta. En fait, elle représente des fermiers américains de l'Arkansas qui à cause de la fameuse crise des années 30 se voient obligés d'abandonner leur terre et de suivre l'exode vers la Californie (voir le film Les raisins de la colère de John Ford tourné en 1940). Par ailleurs, certains croient qu'il est impossible de traduire de l'information visuelle à l'intérieur d'une structure verbale et même que le langage verbal est inadéquat pour exprimer le langage visuel. Parce que " les images sont des sujets alors que des livres sont à propos de sujets " (Murray, 1984). Il est peut-être possible de faire passer le message sémantique d'une image qui est d'ordre logique mais pas son aspect esthétique qui n'est pas transférable à moins de perdre une partie de la valeur du message pictoriel (Mole dans Murray, 1984). Encore de nos jours il est question de ce problème, Elaine Svenonius (1994) se penche sur la question de transfert du visuel vers le textuel et Dennis Hogan (Baxter et Anderson, 1995) dit même qu'il faut utiliser autre chose que du verbal pour indexer le non-verbal.

Figure 3
Bléry, Ginette. 1981. La mémoire photographique, étude de la classification des images et analyse de leur contenu grâce à l'aide de l'informatique. Interphotothèque, no 41. p. 22.

3.7. Normes

Par ailleurs, Graeme Baxter et Douglas Anderson (1995) mentionnent le manque de normes pour l'indexation des images. Déjà au début des années 80, Thomas Ohlgren faisait état du besoin évident de normes pour la classification et la description d'images.

3.8. Autres problèmes

Il y a d'autres aspects à considérer aussi : certaines images comme diapositives, coupures de journaux ou illustrations de livres coûtent peu et ont une durée de vie courte, l'indexation de tels items vaut-il la peine surtout si son coût dépasse celui de l'acquisition et le maintient de telles collections? De plus, la quantité d'images augmente tellement ces jours-ci qu'un système d'indexation qui pouvait être efficace pour de petites collections peut devenir inutilisable lorsque la collection double ou triple d'importance. Aussi, si les images sont indexées ou classifiées sous des vedettes-matières trop larges, il est alors presque impossible de les repérer ce qui équivaut à les perdre. De plus, il est courant que le personnel s'occupant de telles collections ne possède ni de formation en sciences de l'information ni la connaissance des principes et procédures pour le maintien de ce genre de documents. Il en découle que les personnes responsables de ces collections se sentent débordées et que la situation est difficile à améliorer étant donné la pénurie de cours offert sur l'organisation de matériels pictoriels (Murray, 1984).

Comme le mentionne Peter Enser (1995), il est facile de générer des documents mais difficile d'y obtenir un accès physique et encore plus difficile de repérer les quelques-uns qui satisferaient un besoin spécifique d'information.
 

4. Recherches à faire

En effectuant la revue de littérature dans le domaine de l'indexation des images, bon nombre d'articles mentionnent des pistes et idées de recherche qui contribueraient à l'avancement du domaine. Voici les grands champs qui ont pu être déterminés grâce aux lectures.

Shatford Layne (1994) mentionne un besoin de recherche concernant la stratégie de recherche d'images, le choix des termes d'indexation, les requêtes utilisées par l'usager et les raisons qui font en sorte que les images repérées sont utiles.  Toujours selon Layne (1994), il faudrait effectuer des recherches quantitatives pour déterminer quels seraient les meilleurs attributs des images examinées sous lesquels elles devraient être indexées. Or, la récente thèse de doctorat de Layne (1997) pourra servir de tremplin à d'autres recherches dans ce domaine.

Selon Karen Markey Drabenstott 1988), il y avait un manque de recherche au niveau des usagers de collections visuelles. Cependant, est-ce encore le cas de nos jours, dix ans après la publication de cet article? En se basant sur la revue de littérature que ses étudiants mettent sur pied au niveau de la maîtrise et du doctorat en sciences de l'information à l'Université de Michigan, il semblerait que la situation soit toujours la même, i.e. qu'il existe très peu de littérature et de recherche concernant les usagers de collections visuelles (Drabenstott, 1998). Que sait-on de leurs requêtes ? De leurs besoins en information ? De l'utilisation éventuelle du matériel qu'ils recherchent dans ces collections ? Sait-on s'ils réussissent à trouver ce qu'ils cherchent dans ces collections ? Y a-t-il un type d'usager qui réussi plus que d'autres ? Quelles sont les caractéristiques de ces usagers en particulier ? Est-ce que le taux de réussite lors de recherches dans les collections de ressources visuelles est différent de recherches effectuées dans des collections traditionnelles basées sur l'imprimé ?

Il faudrait aussi se pencher sur la question de perception et mémoire visuelles. Rita Murray (1984) considère que de telles recherches permettraient aux bibliothécaires de mieux choisir la façon d'organiser leur collection d'image et de la rendre accessible ce qui contribuerait peut-être éventuellement à l'élaboration d'une théorie de l'analyse du sujet et même de la représentation de l'image.

L'indexation d'une collection d'images est primordiale pour son bon fonctionnement. Odile Le Guern (1989) mentionne que le processus d'indexation devrait s'intéresser à la sémiologie de l'image qui lui indiquerait des pistes pour une meilleure description des documents tout en lui fournissant une grille d'analyse valable une fois pour toutes et pour toutes les images.

Selon Graeme Baxter et Douglas Anderson (1995), il faudrait concevoir un projet qui examinerait les normes pour l'indexation et le repérage d'images, d'un point de vue multidisciplinaire comme ce que le Getty Art History Information Programme fait en ce moment pour les images en art et les objets culturels. Même que la mise en œuvre de recherches dans le but d'identifier et de développer des mécanismes reconnus de façon internationale pour le repérage d'images devrait être une priorité.

Le nombre impressionnant de projets en chantier de nos jours atteste de la popularité du repérage des images par des moyens informatiques. En effet, ce domaine ouvre la voie à de nombreuses recherches pleines de défis. Toutefois, le langage visuel qui est à la base des thésaurus visuels, de la reconnaissance de formes, et de bien d'autres systèmes de classification nécessite de solides connaissances dans le domaine mathématique et informatique.
 

5. Conclusion

 Ce survol a permis de brosser un portrait général du monde de l'indexation des images en mentionnant les grands projets d'organisation d'images dans le domaine des arts lorsque l'intérêt pour les collections visuelles s'est accru à la fin des années 70 et le début des années 80 comme la Image Access Society of North America, la List of Subject Headings pour la Library of Congress Prints and Photographs Division, le Thésaurus de la Division de l'iconographie des Archives publiques du Canada et le Art and Architecture Thesaurus (AAT). Par la suite, les grands systèmes d'indexation d'images ont été regroupés et expliqués sous les rubriques suivantes : méthodes d'indexation basées sur thésaurus et systèmes de classification, thésaurus visuels et systèmes hybrides associés, langages de description pictorielle et indexation et repérage d'images par contenu. Finalement, les problèmes liés à l'indexation des images ainsi que les recherches à faire dans le domaine des images permettent de faire le point sur les directions futures que devraient considérer les chercheurs en sciences de l'information.

En effet, Cawkell (1993) mentionne qu'en plus d'un manque extraordinaire de littérature dans le domaine de l'indexation des image, il semblerait même que cette question soit évitée par les professionnels et les chercheurs concernés. Il en découle que les personnes oeuvrant dans le domaine du traitement et de la reconnaissance d'images ignorent souvent les travaux de ceux qui s'occupent de l'organisation et du repérage d'images et vice-versa. Il faudrait donc qu'une atmosphère de collaboration règne si l'on veut profiter de ces deux branches des sciences de l'information où seul l'échange d'information, de théories, d'idées et d'aide pourra faire en sorte que des progrès se réalisent.
 

6. Bibliographie

Baxter, Graeme et Douglas Anderson. 1995. Image indexing and retrieval : some problems and proposed solutions. New Library World 96, no 1123 : 4-13.

Bell, Lesley Ann. 1994. Gaining Access to visual Information. Art Documentation 13, no 2 (Summer) : 89-94.

Besser, Howard. 1990. Visual access to visual images : the UC Berkely Image Database Project. Library Trends 38, no 4 (Spring) : 787-798.

Bléry, Ginette. 1981. La mémoire photographique, étude de la classification des images et analyse de leur contenu à l'aide de l'informatique. Interphotothèque, no 41 : 9-34. (no spécial sur l'analyse de l'image fixe).

Bordogna et al. 1990. Pictorial indexing for an integrated pictorial and textual environment. Journal of Information Science 16, no 3 : 165-173.

Brilliant, Richard. 1988. How an art historian connects art objects and information. Library Trends 37, no 2 (Fall) : 120-129.

Brooks, Diane. 1988. System-system interaction in computerized indexing of visual materials : a selected review. Information Technology and Libraries 7, no 2 (June) : 111-123.

Cawkell, A.E. 1992. Selected aspects of image processing and management : review and future prospects. Journal of Information Science 18 : 179-192.

----------------. 1993. Developments in Indexing Picture Collections. Information Services & Use 13 : 381-388.

Chang, C.-C. et Wu, T.-C. 1992. Retrieving the most similar symbolic pictures from pictorial databases. Information Processing and Management 28, no 5 : 581-588.

Couprie, L.D. 1983. Iconclass : an iconographic classification system. Art Libraries Journal 8, no 2 (Summer) : 32-49.

Drabenstott, Karen. 1998. Courrier électronique envoyé le 17 avril à l'auteur de l'article.

Eakins, J.P. 1993. Design Criteria for a Shape Retrieval System. Computers in Industry 21 : 167-184.

Enser, P.G.B. 1995. Progress in Documentation Pictorial Information Retrieval, Journal of Documentation 51, no 2 : 126-170.

Evans, A. 1987. TELCLASS : a structural approach to TV classification. Audiovisual Librarian 13, no 4 : 215-216.

Falk, Jane E. 1983. Subject Access Systems and the Visual Arts. Master diss., John f. Kennedy University.

Garnier, François. 1984. Thésaurus iconographique : système descriptif des représentations. Paris : Léopard d'or.

Greenberg, Jane. 1993. Intellectual control of visual archives : a comparaison between the Art and Architecture Thesaurus and the Library of Congress Thesaurus for Graphic Materials. Cataloging & Classification Quarterly 16, no 1 : 85-117.

Hogan, M. et al. 1991. The visual thesaurus in a hypermedia environment : a preliminary exploration of conceptual issues and applications, International Conference on Hypermedia and Interactivity in Museums, Pittsburgh, October 1991, Archives and Museum Informatics, Pittsburgh, 1991 : 202-221.

Hudon, Michèle. 1998. Courrier électronique envoyé en avril à l'auteur de l'article.

Keefe, J.M. 1990. The image as document : descriptive programs at Rensselaer. Library Trends 38, no 4 : 659-681.

Krauze, Michael G. 1988. Intelletual problems of indexing picture collections. Audiovisual Librarian 14, no 4 (November) : 73-81.

Le Guern, Odile. 1989. Images et bases de données. Bulletin des Bibliothèques de France 34, no 5 : 422-435.

Lee, Eric et James MacGregor. 1987. Computer retrieval of graphic information. Canadian Journal of Information Science 12, nos. 3-4 (1987) : 80-88.

Leung, C.H.C. et al. 1992. Picture retrieval by content description. Journal of Information Science 18, no 2 : 111-119.

Markey, Karen. 1984. Interindexer consistency tests : a literature review and report of a test of consistency in indexing visual materials. Library and Information Science Research 6 : 155-177.

------------------. 1986. Subject access to visual resources collections : a model for computer construction of thematic catalogs. New York : Greenwood Press.

------------------. 1988. Access to iconographical research collections. Library Trends 37, no 2 (fall) : 154-174.

Milstead, Jessica L. 1994. Needs for Research in Indexing. Journal of the American Society for Information Science 45, no 8 : 577-582.

Murry, Rita. 1984. Criteria for Subject Indexing of Pictures : an Introductory Survey. Master diss., University of Alberta.

Niblack, W. et al. 1993. The QBIC project : querying images by content using colour, texture, and shape in Niblack, W. (Ed.), Storage and Retrieval for Image and Video Databases : Proceedings of the SPIE, no 1908, San Jose, California, February 1993, SPIE, Bellingham, 1993, pp. 173-187.

Ohlgren, Thomas H. 1982. Image analysis and indexing in North America : a survey. Art Libraries Journal (summer) : 51-60.

Pejterson, A. M. 1993. A new approach to design of document retrieval and indexing systems for OPAC users in Raitt, D.I. and Jeapes, B. (Ed.), Online Information 93 ; Proceedings of the 17th International Online Information Meeting, London, 7-9 December 1993, Learned Information (Europe), Oxford, 1993, pp. 273-290.

Petersen, T. 1990. Developing a new thesaurus for art and architecture. Library Trends 38, no 4 : 644-658

Roddy, Kevin. 1991. Subject access to visual resources : what the 90s might portend. Library Hi Tech 9 : 1 (no 33) : 45-49.

Seloff, G.A. 1990. Automated access to the NASA-JSC image archives. Library Trends 38, no 4 : 682-696.

Shatford, Sara. 1984. Describing a picture : a thousand words are seldom cost effective. Cataloging & Classifcation Quarterly 4, no 4 (Summer) : 13-30.

------------------. 1986. Analyzing the subject of a picture : a theoretical approach. Cataloging & Classifcation Quarterly 6, no 3 (Spring) : 39-62.

------------------. 1994. Some Issues in the Indexing of Images. Journal of the American Society for Information Science 45, no 8 : 538-588.

Sherman, C.R. 1987. ICONCLASS : a historical perspective. Visual Resources 4, no 3 : 237-246.

Soergel, Dagobert. 1994. The Art and Architecture Thesaurus (AAT): A Critical Appraisal. Visual Resources X, no 4 : 369-400.

Svenonius, Elaine. 1994. Access to Nonbook Materials : The Limits of Subject Indexing forVisual and Aural Languages. Journal of the American Society for Information Science
45, no 8 : 600-606.

Teel, Kay. 1992. Subject access to visual materials. SIG/CR News (American Society for Information Science, Special Interest Groupe/Classification Research) 3 (August) : 1-5.

Turner, James M. 1993. Subject Access to Pictures : Considerations in the Surrogation and Indexing of visual Documents for Storage and Retrieval. Visual Resources IX : 241-271.

---------------------. 1994. Indexing " Ordinary " Pictures for Storage and Retrieval. Visual Resources X : 265-273.

Vézina, Raymond. 1998. Entrevue le 23 février.
 


Survol du monde de l'indexation des images.


Retour à la Table des matières -- Page d'accueil de Cursus -- Page d'accueil de l'EBSI