ISSN 1201-7302 | Cursus vol. 6 no 1 (automne 2001) |
Pierre Chaperon
Cursus est le périodique électronique étudiant de l'École de bibliothéconomie et des sciences de l'information (EBSI) de l'Université de Montréal. Ce périodique diffuse des textes produits dans le cadre des cours de l'EBSI.
Courriel : cursus@ebsi.umontreal.caTout texte demeure la propriété de son auteur. La reproduction de ce texte est permise pour une utilisation individuelle. Tout usage commercial nécessite une permission écrite de l'auteur.
L'auteur est détenteur d'une maîtrise en sciences de l'information depuis 2001, ainsi que d'un baccalauréat en science politique et d'un certificat en économique depuis beaucoup plus longtemps, en plus d'avoir oeuvré dans les services linguistiques pendant un bon moment. Intéressé par le traitement documentaire et grand amateur de cinéma, l'indexation des images en mouvement ne pouvait qu'attirer sa curiosité.
Avec le développement du multimédia, la place des images en mouvement dans les collections documentaires est appelée à connaître une croissance importante. Des plans individuels, retirés de leur contexte, peuvent s'insérer dans de nouvelles productions et ainsi faire l'objet de recherches, intérêt potentiellement profitable exigeant un minimum d'organisation. La spécificité de ces documents audiovisuels fait en sorte que leur indexation passe par des outils différents de ceux prévus pour les documents traditionnels. Néanmoins, leur indexation passe toujours par des mots et, en voyant sur quoi reposent les décisions à prendre pour la gestion des collections d'images en mouvement, quant aux choix concernant le vocabulaire notamment, on constate qu'on pourrait parler des vocabulaires d'indexation, tellement la terminologie, en portant sur plusieurs aspects, peut être hétéroclite. Ce texte se propose donc d'analyser la problématique soulevée par l'indexation des images en mouvement et d'explorer les avenues qui s'offrent à elle.
Une première partie servira à établir une distinction entre produits finis et plans, et une autre, à l'intérieur des produits finis, entre documentaires et fictions. Les options qui s'offrent pour l'organisation intellectuelle des collections d'images en mouvement seront ensuite abordées. Sur la question du vocabulaire, les problèmes de constance et de concordance seront discutés, qui mèneront à une préférence pour un vocabulaire contrôlé, ainsi que les questions soulevées par le niveau de l'indexation et l'interprétation des images, qui précéderont un survol des divers chemins à emprunter pour y accéder. Enfin, les possibilités offertes par l'indexation automatique et les efforts de normalisation entrepris constitueront le dernier point.
Les images en mouvement faisant l'objet d'une indexation peuvent être regroupées selon deux typologies principales. La première porte sur le degré d'achèvement du document, à savoir s'il s'agit d'un produit fini, c'est-à-dire d'une oeuvre complète en soi, ou d'un simple plan, inclus dans une oeuvre ou rejeté au montage. La seconde typologie se rapporte au genre artistique du document et s'applique uniquement aux produits finis. On voit mal en effet comment on pourrait attribuer l'étiquette de "comédie" ou de "drame" à un plan séparé de son contexte, même si une séquence peut être drôle ou tragique. Une typologie supplémentaire touche aux techniques de tournage utilisées, que ce soit pour le cinéma, la vidéo ou la télévision (le format de la pellicule, par exemple), propriété pouvant faire l'objet d'une indexation au chapitre des procédés audiovisuels.
On peut diviser les produits finis d'images en mouvement en deux groupes : les documentaires et les fictions. Les deux types, s'ils sont pris dans leur ensemble, peuvent être traités comme des livres ou des articles. Pour le catalogage, cela ne pose aucun problème, mais, sans doute parce qu'on considère le documentaire comme un meilleur véhicule pour la transmission de l'information et des connaissances, la pratique de l'indexation des films de fiction n'est pas très courante. Associés à l'émotion et au divertissement, ils ne constituent pas un objet privilégié de l'analyse documentaire. On se contente souvent de leur attribuer un genre artistique, sous lequel on regroupe une quantité impressionnante d'oeuvres, accompagné ou non d'un résumé. Dans ces conditions, une recherche non structurée risque de se révéler peu efficace et de produire beaucoup de bruit. Pourtant,
le film de fiction peut être un objet d'investigations tout autant qu'un documentaire, notamment par l'étude des représentations sociales qui y sont données et des renseignements que fournit une société par l'image qu'elle véhicule d'elle-même. À ce titre, il peut être considéré comme un document social et historique (Moulis, p. 173).
En plus d'être les véhicules d'une expression artistique, les oeuvres de fiction ont donc valeur de témoignage, d'où l'utilité d'un index pour leur étude. Un film ayant comme sujet une société particulière contemporaine de l'époque du tournage devrait rendre compte de cette société mieux que le ferait un film historique qui essaierait de reconstituer le mode de vie à une période donnée. De la même façon, un film tourné aujourd'hui, dont l'action se déroulerait aussi aujourd'hui, à l'intérieur d'une communauté qu'on serait en mesure d'identifier, témoignera de la société actuelle aux générations futures.
On pourrait considérer cet aspect comme la valeur testimoniale extrinsèque d'un film de fiction, en ce sens qu'il n'a pas été produit dans ce but et que le réalisateur ne visait probablement pas à lui donner une telle valeur, à moins de tourner une fiction avec un objectif documentaire. Il est également possible que cette valeur ne soit saisie que des années après la sortie du film, pour lequel cas il faudrait prévoir un retour sur l'indexation initiale. On suppose qu'un réalisateur cherche d'abord à raconter une histoire qui donne au film sa valeur intrinsèque, facteur à ne pas négliger, car, en dehors des genres cinématographiques généraux, un film peut traiter de thématiques particulières qu'il serait tout à fait pertinent d'inclure dans une indexation. Il peut s'agir par exemple d'un événement historique, d'un personnage connu, d'un phénomène de société, etc., dont on étudie le traitement que lui a réservé le cinéma ou la télévision. À cet effet, les sélections établies par la Boîte Noire dans son Guide vidéo 2000 (p. 690-721) constituent une approche intéressante, quoique partielle, qui mériterait d'être étendue.
Tout comme un simple plan ne peut subir le même traitement documentaire qu'une oeuvre complète en elle-même, celle-ci, en raison de la multitude d'images qu'elle contient et des coûts entraînés, ne se prête pas à une analyse détaillée plan par plan au moyen d'une indexation humaine, bien qu'en théorie cela soit possible. Un plan est une prise de vue sans interruption captée au moyen d'une caméra; on peut aussi le désigner par les images qui résultent de cette opération et par ce qui en reste après les coupures effectuées au montage. Il peut être inclus dans la production finale ou rejeté. Dans ce dernier cas, il devient ce qu'on appelle une chute, mais peut être sélectionné pour intégration éventuelle dans une autre production, de nature commerciale ou publicitaire par exemple, et bénéficier d'une seconde vie; on parle alors de stockshot. " Le stockage et le repérage des stockshots exigent un important travail de catalogage et d'indexation. Ce sont les bénéfices potentiels à tirer des redevances pour l'utilisation du matériel qui justifient les investissements nécessaires " (Turner, 1998, p. 9). Il s'agit donc d'un domaine qui offre de prometteuses perspectives d'avenir. Aussi l'indexation de ce type de document constitue-t-il l'essentiel des propos qui suivent.
À partir du moment où une collection rassemble un nombre d'objets trop élevé pour y repérer une pièce en particulier, il faut mettre sur pied un système apte à la repérer, ainsi que toutes les autres. L'élaboration d'un système de repérage, quel que soit son objet, nécessite l'organisation de la description de son contenu. Le développement de vocabulaires contrôlés tels que Iconclass et le Art & Architecture Thesaurus, pour l'indexation d'images fixes de nature artistique, ne convenant pas aux images "ordinaires", sans parler de leur adaptation aux images en mouvement, il faut se tourner vers d'autres solutions.
Une première réponse à ce problème consiste à adopter les méthodes employées pour les collections générales, qu'il s'agisse de schémas de classification (comme ceux de Dewey, de la Library of Congress ou de la Classification décimale universelle) ou de vedettes-matière. Les résultats pourraient être intéressants, mais essentiellement pour les produits finis. Toutefois, ces méthodes éprouveraient de sérieuses difficultés à rendre compte des unités qui composent un produit fini. Ce qu'on peut trouver dans un plan, de l'objet le plus banal à l'expression la plus subtile, donne lieu à une infinité de possibilités qu'aucune classification ne peut prévoir. Et c'est sans compter les aspects techniques ou le contenu implicite des images.
La solution qui vient à l'esprit le plus rapidement consiste en l'attribution de mots-clés aux images en mouvement. C'est aussi ce qui semble le plus naturel quand il s'agit de nommer des objets, des personnes ou des événements. Une étude empirique démontre que c'est ce que les gens font spontanément (Id., 1994). Mais l'idée d'un vocabulaire libre, laissé à la discrétion des indexeurs, apparaît comme une option à rejeter d'emblée, en raison des formes multiples que peut emprunter un concept, cause d'inconstance dans l'indexation et de faiblesse au repérage. Un vocabulaire contrôlé s'imposerait donc. Et selon Moulis, les indexeurs d'images en mouvement ne peuvent s'en remettre à ce qui existe déjà, en raison de lacunes dans les relations entre les champs sémantiques, d'une part, et entre les termes, d'autre part :
Cela condamne les documentalistes à bâtir leurs propres thésaurus afin de répondre aux exigences de la recherche documentaire : pertinence et refus de l'ambiguïté, aménagement de dispositifs qui élargissent la recherche documentaire d'images animées en conjugant rigueur du thésaurus et souplesse de relations entre les domaines, pertinence des termes utilisés et possibilités d'interrogations multiples pour rendre à l'image sa richesse polysémique (p. 177).
Si le sujet est le critère qui vient à l'esprit le plus naturellement, d'autres peuvent aussi faire l'objet d'une recherche et sont donc susceptibles d'être retenus comme éléments d'indexation. On parle aussi d'informations que ne peut divulguer l'image et qui ne peuvent être identifiées automatiquement, qui exigent de l'indexeur des connaissances appropriées : le nom d'une personne, d'un édifice, une date ou un endroit précis.
Si l'on encode ce genre d'informations dans des modules d'indexation d'un système d'information, on voudra certainement le faire à partir de vocabulaires contrôlés, qu'il s'agisse de fichiers d'autorité ou d'autres types de fichiers.Le choix des descripteurs devra donc s'opérer en prévision d'un système le plus performant possible.
Une façon de faire pratique est d'associer à chaque champ d'indexation un vocabulaire contrôlé qui exprime de la façon la plus exacte possible l'indexation qu'on voudra relier à un plan (Turner, 1998, p. 70).
Mais le problème avec les descripteurs, c'est qu'ils ne peuvent rendre compte de tout ce que contient une image (Roddy, p. 47). On peut y remédier grâce à des descriptions plus détaillées en langue naturelle. Les indexeurs sont en mesure de résumer une séquence, mais la condensation de chaque plan d'une collection est une solution à proscrire, en raison des coûts qu'elle implique. Aussi vaut-il mieux se servir de ce qui existe déjà. Des textes créés pour la production de matériel audiovisuel (sous-titres, scénarios, scripts, storyboards, etc.) peuvent être utilisés à cette fin. Parmi eux, l'audiovision, conçue pour permettre aux handicapés visuels de suivre une émission, constitue une avenue intéressante : " Puisque ces textes sont créés par des professionnels expressément pour les malvoyants, il est fort probable qu'ils sont riches en informations verbales permettant de "visualiser" l'image " (Turner, 1998, p. 58). Nul doute que les textes en question contiendraient des mots significatifs. Un champ "résumé" pourrait ainsi compléter l'indexation accomplie. Le bruit provoqué au repérage par une abondance de mots peut toujours être diminué en effectuant une recherche par descripteurs dans les champs d'indexation, la recherche en texte intégral se limitant au champ "résumé", ce qui est rendu possible grâce aux balises logiques des documents structurés. Le problème majeur qui reste à régler est la quantité de mémoire requise par un système qui intégrerait autant d'informations, mais on sait que les ordinateurs voient leurs capacités augmenter rapidement et de façon impressionnante.
Un thésaurus visuel constitue une autre avenue. Il permet la représentation visuelle des concepts présents dans un vocabulaire d'indexation, donnant accès à une banque d'images, sans qu'il y ait besoin de traduction additionnelle des représentations linguistiques. Sur ces bases, la NASA en a développé un, relié à un thésaurus conventionnel, où un terme choisi par un usager conduit à des images qui lui sont associées (Rasmussen, p. 182). La majorité des organisations ne disposent cependant pas des ressources financières de la NASA. Mais peu importe l'option (ou la combinaison d'options) retenue, les éléments à prendre en considération demeurent toujours la nature de la collection et son environnement.
L'indexation des images en mouvement nécessite le recours à des mots, qui doivent rendre compte, le plus précisément possible, du contenu des images en question. Celles-ci constituant une représentation et l'indexation étant une représentation de contenu, on peut conclure par syllogisme que l'indexation d'images est la représentation d'une représentation.
Dans ce transfert, la description de l'image s'effectue en trois étapes : identifier, reconnaître, nommer. Or on ne peut identifier, et donc nommer, que ce que l'on connaît déjà. Ce qui veut dire que l'analyste doit posséder le référent culturel adéquat pour le faire, et le vocabulaire qui lui permettra de décrire l'image. [...] Le risque est bien sûr la perte d'information due à la méconnaissance de l'indexeur, mais aussi celui d'une lecture conduite avec ses propres préjugés culturels, politiques, éthiques (Moulis, p. 175).Ceci dit, le problème se pose dans des contextes très précis où, à moins de compter sur une équipe de spécialistes, le recours à un dictionnaire visuel peut s'avérer utile. Toutefois, usagers et indexeurs ne disposent pas nécessairement des mêmes outils, et encore moins des mêmes référents culturels.
Outre l'objectivité dont doit faire preuve l'indexeur, les termes qu'il choisit doivent correspondre à ceux employés par un usager dans une requête de recherche. À quoi servirait un système qui ne permet pas à ceux qui l'interrogent d'y trouver l'information dont ils ont besoin? Il s'agit d'une question vitale pour la survie d'un tel système, avec des implications pour l'organisation et le personnel dont il dépend. On peut même parler ici de dépendance réciproque. Le problème repose sur la polysémie et son inverse : une expression peut désigner plusieurs concepts et un concept peut être désigné par plusieurs expressions. La nature humaine étant ce qu'elle est, une personne qui choisit un mot pour représenter un objet trouvera son choix évident (Turner, 1996), mais celui-ci ne coïncidera pas nécessairement avec un mot choisi par une autre personne, tout aussi convaincue de l'évidence de son choix. Par exemple, les mots "faune" et "animaux" font référence à un même concept, mais une base de données sans système de renvoi frustrera l'utilisateur en ne lui donnant accès, au mieux, qu'à une partie des documents pertinents présents dans la collection. On peut multiplier indéfiniment des exemples de ce genre. Des usagers réguliers finissent par développer des réflexes qui leur permettent de s'ajuster aux conceptions des indexeurs qui diffèrent des siennes, mais l'usager nouveau ou occasionnel, s'il n'a pas la chance de trouver le terme approprié, ne pourra mettre la main sur toute l'information désirée.
Il convient ici d'apporter des nuances. Si des études ont montré que les probabilités qu'un usager et un indexeur utilisent le même terme pour représenter un objet sont plutôt minces (Furnas et al., p. 965-966), les choses ne vont pas si mal quand il s'agit de nommer les objets présents dans une image. Si plusieurs mots peuvent être employés pour un même objet, beaucoup ne reviennent qu'une fois et seuls quelques-uns sont répétés (Turner, 1996). Et régulièrement, un mot plus populaire que les autres fait l'objet d'un consensus parmi les participants aux recherches. Le niveau de complexité a aussi une incidence sur l'uniformité de l'indexation; des images simples donnent de meilleurs résultats que d'autres plus complexes (Id., 1994, p. 124). Ceci accrédite la thèse voulant qu'un expert serait mieux en mesure d'indexer une collection spécialisée, alors que le problème ne se poserait pas vraiment pour des images ordinaires. Il apparaît évident en effet qu'une équipe de spécialistes serait mieux en mesure de choisir les termes appropriés relevant d'un domaine précis. Ce genre de recherche permet en tout cas de sélectionner les termes potentiellement utiles pour l'indexation, en vue de leur intégration dans un vocabulaire contrôlé.
Si l'usager avait affaire à un seul indexeur, ou si tous les indexeurs indexaient de la même façon, le problème du vocabulaire pourrait être résolu rapidement de façon assez satisfaisante. Malheureusement, l'uniformité entre indexeurs ainsi que la constance d'un indexeur unique sont pour le moins imparfaites. Il arrive, plus ou moins régulièrement, que des indexeurs emploient des synonymes pour définir une même réalité ou qu'un indexeur unique utilise une variété de termes équivalents dans l'évolution de son travail. En l'absence d'un vocabulaire contrôlé qui ramènerait l'ensemble des équivalences à un unique descripteur retenu comme terme d'indexation, il en résulte qu'un chercheur ne trouvera probablement pas tout ce qui pourrait l'intéresser, parce que des indexeurs n'utiliseraient pas la même expression pour désigner un objet. Markey a voulu appliquer au matériel visuel les tests de constance dans l'indexation de matériel imprimé. Elle explique en partie les résultats inférieurs par le passage du visuel à l'écrit (p. 174). Toujours à partir des études de constance, et en les appliquant aux documents visuels, elle a relevé des observations qui pourraient permettre d'identifier des éléments qui augmenteraient l'uniformité des indexeurs (p. 165-167). Entre autres, on peut noter l'utilisation d'un vocabulaire contrôlé, l'emploi de spécialistes du domaine de la collection, l'expérience des indexeurs et la connaissance de la structure du vocabulaire d'indexation, hypothèses qui paraissent aller de soi. Une autre suppose qu'une diminution du nombre de catégories, de règles de classification ou de termes d'indexation augmenterait la constance entre indexeurs. Encore une fois, cela semble tout à fait logique, sauf que la précision de l'indexation en souffrirait, avec pour conséquence une augmentation du bruit lors des requêtes de recherche, un plus grand nombre de documents, pas nécessairement tous pertinents, étant alors regroupés, avec comme conséquence un travail de sélection supplémentaire pour l'usager. Cela apparaît comme une solution tombant dans la facilité, où l'on se trouverait à remplacer un problème par un autre.
De ce qui précède, on peut conclure qu'un besoin de normalisation se fait sentir, pour des raisons d'efficacité interne propres à chaque organisation possédant une collection, d'autant que " les technologies de l'information se sont maintenant développées à un tel point que l'enjeu est devenu le partage des collections en vue de créer éventuellement une collection "virtuelle" mondiale accessible de n'importe quel point du réseau " (Turner, 1998, p. 38). L'utilisation d'un vocabulaire contrôlé, avec idéalement des relations de hiérarchie et d'association mais surtout d'équivalence - sur le modèle du thésaurus ou des vedettes-matière -, en permettant à l'usager d'utiliser des synonymes pour les termes d'indexation retenus, lui donne l'occasion d'éprouver sa stratégie de recherche et de l'adapter au système, pour obtenir en principe de meilleurs résultats.
La mise sur pied d'un vocabulaire contrôlé implique l'établissement d'une politique pour sa mise à jour et l'ajout de descripteurs, ainsi qu'une certaine coordination dans le travail à accomplir. Les possibilités offertes par l'informatique pour la gestion du vocabulaire permettent une réaction rapide, mais la nature ponctuelle du processus décisionnel diminue le contrôle exercé sur les relations sémantiques (Turner et al.). Le travail s'exécute ici au niveau de l'entreprise individuelle, en fonction de ses buts et de ses besoins, ce qui constitue un frein à la normalisation en vue de l'installation d'un réseau universel, qui nécessite une concertation à une plus grande échelle. Également, si l'élaboration d'un vocabulaire d'indexation pour une collection particulière s'effectue assez bien, en raison du vocabulaire spécialisé qu'elle demande, il n'en va pas de même pour les images ordinaires, pour lesquelles un vocabulaire général est approprié. Mais dans un cas comme dans l'autre, l'emploi d'un vocabulaire contrôlé, accessible pour la recherche sur format imprimé ou en ligne, repose sur la compréhension par l'usager des termes employés par l'indexeur, avec l'effet sur les taux de rappel et de précision que cela suppose (Leung et al., p. 115). Le travail de normalisation de l'indexation des images en mouvement ne s'annonce pas de tout repos, mais il promet en tout cas des perspectives intéressantes pour le spécialiste en sciences de l'information.
Le choix des mots justes n'est pas le seul problème auquel se trouve confronté l'indexeur d'images en mouvement. Il a aussi à décider quels éléments d'un plan sont suffisamment pertinents pour justifier leur sélection pour indexation. La question se pose donc de savoir combien d'objets présents dans une séquence méritent une description. Le critère d'exhaustivité fait face ici à celui de sélectivité. Le problème récurrent de la qualité versus la quantité refait surface encore une fois, et l'indexeur doit faire appel à son jugement et à son discernement.
Devant ce dilemme, on préfère presque invariablement y aller pour la qualité. La difficulté consiste à déterminer les critères qui font qu'une indexation est de qualité. Il n'existe pas de réponse définitive sur ce point, tout dépend de la collection et de son environnement. L'indexeur de matériel imprimé peut toujours compter sur un résumé ou une table des matières pour se faire une idée de l'importance relative des concepts entre eux, ou à tout le moins il a la possibilité de déceler la structure d'un texte en le lisant tout simplement. Les mots seront toujours là pour lui servir d'indices. Celui qui indexe des images ne peut se référer à de tels repères. L'expérience qu'il a avec les usagers peut bien sûr lui servir, mais il doit compter d'abord sur ses propres ressources pour décider si ce qui se trouve en arrière-plan mérite aussi de se trouver dans une description. Et la même interrogation revient pour un mouvement, une expression, un son, etc.
Les risques inhérents à une situation semblable découlent d'un possible déséquilibre entre l'information contenue dans un plan et celle rapportée dans une description, ou encore entre la quantité d'informations transcrites à propos d'une image et leur pertinence pour les usagers. Les conséquences vont d'une augmentation du silence à une augmentation du bruit. Trouver le juste équilibre dépend d'une politique d'indexation judicieuse, établie en fonction des besoins des usagers d'un système et de la mission de celui-ci, de façon à dégager une hiérarchie des types d'information à privilégier, selon les spécificités de la collection à indexer :
il s'agit donc de trier, choisir et mémoriser afin de faciliter l'accès aux documents lors de la recherche, en ayant évalué les besoins des utilisateurs. En ce sens, l'indexation est le reflet des usagers, mais également de l'environnement institutionnel dans lequel elle est effectuée (Moulis, p. 176).
L'indexation se heurte aussi à l'interprétation des images. C'est ici qu'entrent en jeu les trois niveaux de signification définis par Panofsky. Le premier, le niveau pré-iconographique, se limite aux éléments présents dans une image, qu'on peut identifier de façon concrète; on peut donc parler de premier degré, mais aussi de dénotation ou d'ofness. Vient ensuite le niveau iconographique, qui exige de l'indexeur qu'il interprète les images qu'il voit pour déterminer sur quoi elles portent; on parle alors de connotation ou d'aboutness. Enfin, le dernier niveau, dit iconologique, s'attache à la valeur symbolique que peut renfermer une image. On entre ici dans le domaine de l'abstrait.
Or détecter dans une image la représentation d'un concept immatériel exige une culture permettant d'établir la relation entre une image et un concept. Cette culture n'est pas partagée par tous et, de plus, les différences culturelles multiplient les valeurs symboliques qu'on peut attribuer à une même image, d'autant plus qu'un créateur n'a pas toujours conscience de la portée symbolique de son oeuvre. Il y a donc danger de subjectivité dans le travail d'analyse, qui peut mener au détournement d'une oeuvre ou à sa récupération à des fins autres qu'artistiques. Également, si un film peut contenir une valeur symbolique évidente pour certains, surtout dans le cas des films d'auteur, c'est dans son intégralité qu'on peut la percevoir. Dans le cas d'un simple plan détaché de son contexte, cela relèverait plutôt de la mystification. Aussi le côté symbolique ne sera pas traité davantage.
Il reste maintenant à décider si une collection d'images en mouvement doit être indexée au niveau pré-iconographique, iconographique ou aux deux. La décision à prendre dépend bien sûr de la nature de la collection et des attentes des usagers. Les images d'art se prêtent bien à une indexation iconographique, parce qu'elles ont souvent une connotation qui va au-delà de ce qu'elles montrent. Toutefois, les études effectuées tendant à prouver qu'une indexation spontanée d'images s'effectuent à partir de leur contenu objectif, " il est probable que la description pré-iconographique favorise un meilleur repérage en recourant aux noms communs assignés aux objets en guise de descripteurs plutôt qu'aux expressions moins tangibles qui cherchent à refléter leur aboutness " (Turner, 1998, p. 24). Moulis en arrive aux mêmes conclusions lorsque, énumérant les raisons pour lesquelles les thésaurus destinés aux images fixes sont mal adaptés à l'indexation de celles en mouvement, elle mentionne que " la faible part réservée aux mots concrets comparativement aux listes de termes répondant à des thématiques ou à des concepts est souvent un handicap pour indexer une image correctement " (p. 176). Et Leung et al. énumèrent cinq arguments contre une indexation effectuée seulement à partir du deuxième niveau : les systèmes d'indexation au niveau secondaire impliquent une analyse à deux niveaux et une responsabilité accrue de l'indexeur pour les décisions prises, ce qui peut conduire à des désaccords et à de l'incompréhension; l'analyse iconographique peut négliger ou ignorer de l'information utile; l'analyse iconographique oblige l'indexeur à interpréter une image et l'interprétation peut se révéler erronée; l'expertise exigée par des systèmes d'indexation d'images au niveau iconographique ne s'acquiert pas rapidement par les non-initiés; l'indexation d'images au niveau primaire n'exige pas une connaissance approfondie de l'histoire de l'art (p. 113).
Ces arguments n'éliminent pas la faisabilité d'une analyse iconographique des plans individuels, qui pourrait toujours servir à l'utilisation d'une image pour son contenu implicite.
Toutefois, il est probablement inutile de le faire. Accomplir une telle tâche exige un effort considérable de la part de l'indexeur, qui doit imaginer les contextes possibles où l'image pourrait être utilisée. De plus, le danger réside dans le fait qu'il est impossible d'imaginer tous les contextes possibles où l'image pourrait servir. Pour les collections d'images "ordinaires", c'est donc l'usager, et non pas l'indexeur, qui doit trouver la terminologie nécessaire pour formuler sa demande. C'est le créateur d'un produit audiovisuel qui doit décider comment il veut représenter des concepts iconographiques, et non l'indexeur de la collection d'images où cherche le créateur. Une fois que ce dernier a pris sa décision, il a accès à une terminologie au niveau primaire ou pré-iconographique. Prendre de telles décisions concernant la représentation fait partie du processus créatif et appartient à l'artiste, non à l'indexeur (Turner, 1998, p. 68).On n'insistera jamais assez sur ce point : une interprétation peut toujours être contestée. L'indexation au niveau iconographique diminue donc les chances de convergence entre la terminologie d'un indexeur et celle d'un usager. Un créateur a toujours une idée derrière la tête, même si la portée de son oeuvre peut lui échapper au moment de la création. Il faut faire confiance à son intelligence et ne pas essayer de penser à sa place. Quand un tel principe est compris et mis en pratique, on avance d'un pas dans la bonne direction.
Par contre, il peut se montrer parfois indispensable de laisser à l'indexeur une part d'interprétation. Par exemple, il serait difficile d'exprimer une émotion humaine autrement qu'en ayant recours à une séquence contenant un visage humain laissant transparaître ladite émotion, qu'il s'agisse d'euphorie ou de désespoir. Dans le cadre d'une recherche à partir de ce point d'accès, comment formuler une requête autrement qu'en faisant référence à l'émotion elle-même? Une fois de plus, les risques de divergence quant à l'interprétation ne sont pas négligeables, et encore davantage avec un plan séparé de son contexte. " Dans l'image en mouvement le contexte est extrêmement important et influence les perceptions [mais], lorsque les usagers en ont besoin, il vaut mieux offrir un accès imparfait que de ne pas offrir d'accès du tout " (Ibid., p. 64-65). La mission d'une collection et les besoins de ceux qui la consultent doivent donc de nouveau être pris en considération.
En dehors du sujet, d'autres clés d'accès, de nature plus objective, peuvent assurer un repérage de meilleure qualité. On peut les diviser en deux catégories principales : les points d'accès spatio-temporels, communs à tous les genres de documents, et ceux propres aux documents visuels, plus techniques en quelque sorte, qui comprennent les caractéristiques perceptibles de l'image et les procédés employés lors des tournages. Généralement, ces chemins d'accès sont prévus pour être utilisés simultanément avec d'autres, dans le but de préciser une recherche, par la sélection ou l'élimination de documents selon certaines conditions. Se prêtant moins à l'interprétation, ils sont ainsi en mesure de remplir ce rôle.
Les critères géographiques et chronologiques sont ceux qui viennent le plus facilement à l'esprit quand vient le temps de limiter les critères d'une recherche. Ces critères sont couramment employés pour les documents de type traditionnel, ce qui facilite, jusqu'à un certain point, l'adoption d'un système pour la classification et le repérage à partir de ces clés d'accès. Il est préférable de se servir de ce qui existe déjà, plutôt que de réinventer la roue. Mais les documents visuels, surtout les images en mouvement, possèdent des particularités qui obligent les concepteurs à raffiner leurs systèmes. En effet, il faudra établir une distinction, s'il y a lieu, entre le moment d'un tournage et la période historique qu'il est censé représenter. On peut d'ailleurs s'amuser à essayer de trouver une solution pour un film de science-fiction tourné dans les années 1950, dont l'action se déroule sur terre à une époque aujourd'hui révolue. Un film de ce genre pourrait fort bien intéresser quelqu'un étudiant la perception du futur pendant la guerre froide, par exemple. La mention du genre cinématographique prendrait ici toute son importance. De la même façon, sur le plan géographique, un décor de Montréal peut servir à une scène se déroulant aux États-Unis, ou une chasse à l'homme dans le désert de l'Arizona au XIXe siècle peut être tournée en Espagne. Cette particularité vaut bien sûr pour les films de fiction et les reconstitutions historiques; les séquences tournées sans scénarisation ne se prêtent pas à cette double précision. De toute façon, il y a un public potentiel pour les deux genres.
Sur un plan plus technique, il serait paradoxal de ne pas tenir compte de ce qui fait la spécificité des images en mouvement pour leur indexation. En autant qu'il s'agisse d'éléments pertinents, on peut très bien indexer un document audiovisuel à partir des caractéristiques qui lui sont propres : couleurs, formes, sons, mouvements... Également, tout ce qui touche aux techniques de tournage, aux angles de caméra constitue des points d'accès potentiels pour l'initié au langage cinématographique : gros plan, vue aérienne, contre-plongée, plan-séquence, éclairage, durée...
La liste est longue de ce qu'on pourrait demander. Bien sûr, chaque organisation peut se limiter aux éléments qui lui sont essentiels mais, pour permettre des échanges d'informations à grande échelle, des efforts de normalisation sont souhaitables. La terminologie spécifique au domaine audiovisuel devrait faciliter la coordination des efforts déployés dans ce but.
Si l'on considère le plan comme unité de base pour l'indexation des images en mouvement, on imagine difficilement la somme de travail colossale que cela implique. La production croissante de matériel audiovisuel oblige déjà à opérer une sélection. Et tout ce qui est produit fini, émission de télévision ou film de fiction, peut se décomposer en une suite de plans très diversifiés, tant par leur durée que par leur aspect formel et leur contenu. Aussi l'utilisation des capacités de l'informatique est-elle un point qu'on ne peut se permettre de contourner.
Mais les indexeurs peuvent se rassurer : ce n'est pas demain que les ordinateurs pourront effectuer tout leur travail. C'est ici qu'entre en jeu la distinction entre indexation basée sur le concept et indexation basée sur le contenu. L'indexation basée sur le concept relève de l'indexeur humain parce que, exception faite de quelques domaines très précis, l'identification d'objets dans une image s'avère une tâche difficile à accomplir de façon automatique (Rasmussen, p. 179). Cette pratique se heurte toutefois à des limites relevant de la nature humaine. En plus d'un coût élevé, elle demande un haut niveau d'abstraction qui, avec la part de subjectivité qui l'accompagne, rend la constance difficile à atteindre, du moins pour les images complexes. De plus, il est bien hasardeux de prévoir, au moment de l'indexation, à quelle requête une image pourra bien servir (Ibid., p. 182-183). Mais il faut convenir qu'une indexation plan par plan ne sera que partielle si elle ne relève que de l'indexation humaine. La somme de travail à accomplir nécessiterait la contribution d'une armée d'indexeurs qu'aucune organisation ne serait en mesure d'engager.
C'est pourquoi l'indexation automatique peut venir en aide à l'indexeur humain - et par le fait même aux usagers d'une base de données sur des images en mouvement - en permettant de préciser une recherche à l'aide de données supplémentaires, favorisant un meilleur repérage. Bien sûr, une telle analyse doit porter sur des éléments objectifs, pour lesquels l'interprétation est réduite au minimum, tels que ceux pouvant faire l'objet de clés d'accès pour les caractéristiques techniques ou perceptibles d'un plan. Il est cependant douteux qu'on en arrive bientôt à une analyse complète de l'image par ordinateur, qui se heurte au contenu textuel des bases de données, d'autant plus que les mots restent encore pour les chercheurs d'information le meilleur moyen de traduire leurs besoins.
La numérisation des images animées a permis de développer des recherches sur l'analyse automatique des images. La plupart des banques de données images sont en fait des banques de données textuelles donnant accès à des fonds d'images animées. Elles ont été créées pour permettre d'accéder directement et visuellement aux images et, ce faisant, d'alléger la description documentaire et le travail des documentalistes. [Pour l'instant,] l'analyse automatique des images reste encore associée à des descriptions textuelles et vient en complément d'une analyse documentaire classique (Moulis, p. 177-178).
Des efforts de normalisation doivent accompagner les développements qui se dessinent à l'horizon, si l'on veut éviter le chaos que provoqueraient les tentatives d'interconnexion de systèmes incompatibles. À l'heure actuelle, les initiatives les plus avancées proviennent du Dublin Core et du projet de norme MPEG7.
L'initiative du Dublin Core consiste en l'élaboration de champs prévus pour l'entrée de métadonnées servant à la description de documents électroniques, en vue de permettre leur diffusion en réseau. On pense évidemment à Internet et à l'indexation précise que pourraient effectuer les moteurs de recherche présents sur le Web, grâce aux indications facilement repérables contenues dans les métadonnées. Soulignons ici la responsabilité que peut assumer un créateur, en choisissant lui-même les termes d'indexation du document à diffuser, ce qui allégerait encore la tâche de l'indexeur.
Quant au projet de norme MPEG7 (pour Motion Picture Experts Group), il a été établi précisément pour les images en mouvement. Moulis le résume en ces termes :
Il s'agit de définir un "ensemble standard de descripteurs multimédias", afin d'accéder directement à des extraits de films et de pouvoir les visualiser. En utilisant les travaux existants sur l'analyse automatique des images animées, on pourra extraire automatiquement certains aspects formels de l'image : couleurs, formes, mouvements de caméra, ainsi que des éléments du contenu. Il s'agit donc de mettre en place un langage favorisant plusieurs niveaux de description selon les usages qui peuvent en être faits. MPEG7 prévoit la possibilité d'une indexation très fine, réalisée par des documentalistes et en mode textuel, et laisse la voie ouverte aux développements offerts par la recherche sur l'indexation automatique des images (Ibid., p. 178).
Il semble donc se dégager des tendances qui se dessinent une part de plus en plus importante attribuée à l'indexation automatique, et qu'on se dirige vers une division du travail entre l'ordinateur et l'indexeur humain. La machine prendrait en charge l'analyse plan par plan, en raison de sa capacité à assimiler un grand nombre de données en peu de temps, et s'arrêterait au contenu objectif des images; l'indexeur humain se concentrerait sur les produits finis, en raison de sa concision et de son esprit de synthèse, et se chargerait de l'interprétation des images.
L'indexation des images en mouvement diffère selon qu'elle porte sur un produit fini ou un simple plan. L'analyse d'un film ou d'une émission de télévision se rapproche de celle réservée aux documents imprimés, qui peuvent aussi bien raconter une histoire fictive que traiter d'un sujet particulier. Un plan, cependant, traité hors de son contexte et par sa nature même incomplet, ne peut subir un traitement documentaire traditionnel. Aussi une collection de plans nécessite-t-elle une organisation adaptée à son contenu et aux besoins de ceux qui la consultent.
Le choix des descripteurs, pour la mise sur pied d'un vocabulaire contrôlé, devrait s'en tenir de préférence au niveau pré-iconographique, afin d'éviter le plus possible les divergences d'interprétations qui surviennent au niveau iconographique. Sans éliminer les risques d'inconstance, une telle mesure augmente les chances qu'un usager tire profit de l'exploitation d'un système. La multiplication des clés d'accès est un autre moyen d'améliorer le repérage, en éliminant ou en sélectionnant les images en fonction de critères spatio-temporels ou techniques. Les caractéristiques propres aux documents audiovisuels constituent autant de points d'accès en mesure de préciser une requête.
Mais l'indexation plan par plan implique des sommes énormes et rend indispensable le recours à l'ordinateur pour être menée de façon satisfaisante. Les recherches en indexation automatique visent à permettre l'analyse des éléments formels de l'image de façon économique et rapide, tandis que l'intégration aux banques de données d'éléments textuels accompagnant la production audiovisuelle enrichit leur contenu tout en augmentant le potentiel des systèmes. Enfin, la croissance des collections d'images en mouvement et leur intégration éventuelle à un réseau, pour favoriser l'échange d'informations, demandent des efforts de normalisation. Les métadonnées du Dublin Core, pour la description de documents électroniques en ligne, et les descripteurs multimédias du projet de norme MPEG7, pour les images en mouvement, vont en ce sens. Aussi les perspectives d'avenir dans ce domaine s'annoncent-elles intéressantes.
Boîte Noire. Guide vidéo 2000. Montréal : Fides, 1999. 876 p.
Bower, James M. "Vocabulary coordination projects in the art information community." Bulletin of the American Society for Information Science 18, no 2 (1992): 19-21.
Bower, James M. "Vocabulary control and the virtual database." Knowledge Organization 20, no 1 (1993): 34.
Dublin Core Metadata Initiative. [Page d'accueil]. (Page consultée le 29 avril 2001), [En ligne]. URL: http://dublincore.org/
Fugmann, Robert. "The complementarity of natural and indexing languages." International Classification 9, no 3 (1982): 140-144.
Furnas, G.W. et al. "The vocabulary problem in human-system communication." Communications of the ACM 30, no 11 (1987): 964-971.
Organisation internationale de normalisation. Overview of the MPEG-7 standard (version 5.0). (Page consultée le 29 avril 2001), [En ligne]. URL: http://www.cselt.it/mpeg/standards/mpeg-7/mpeg-7.htm
Jörgensen, Corinne. "Attributes of images in describing tasks." Information Processing & Management 34, nos 2-3 (1998): 161-174.
Leung, C.H.C. ; Hibler, D. ; Mwara, N. "Picture retrieval by content description." Journal of Information Science 18 (1992): 111-119.
Markey, Karen. "Interindexer consistency tests: a litterature review and report of a test of consistency in indexing visual materials." Library and Information Science Research 6 (1984): 155-177.
Moulis, Anne-Marie. "L'analyse documentaire des images animées." Documentaliste: Sciences de l'information 36, no 3 (1999): 171-178.
Moving Picture Experts Group. The MPEG home page. (Page consultée le 29 avril 2001), [En ligne]. URL : http://www.cselt.it/mpeg/
Rasmussen, Edie M. "Indexing images". Annual Review of Information Science and Technology (ARIST) 32 (1997): 169-196.
Roddy, Kevin. "Subject access to visual resources: what the 90s might portend." Library Hi Tech 9, no 1 (1991): 45-49.
Société Radio-Canada. Services documentaires de l'information. Archives sonores et visuelles. [Montréal : La Société], 2000. 21 p.
Trant, Jennifer. ""On speaking terms": towards virtual integration of art information ." Knowledge Organization 20, no 1 (1993): 8-11.
Turner, James Ian Marc. Determining the subject content of still and moving image documents for storage and retrieval: an experimental investigation. [Toronto : University of Toronto], c1994. ix, 300 p.
Turner, James M. 1996. Le traitement de l'image en environnement numérique. (Page consultée le 29 avril 2001), [En ligne]. URL: http://tornade.ere.umontreal.ca/~turner/francais/textes/asted96.htm
Turner, James M. "The organization of moving-image metadata: a research agenda". In: Williams, Martha E. Proceedings of the 18th National Online Meeting, New York, May 13-15, 1997, p. 349-356. Medford, NJ: Information Today, c1997.
Turner, James M. Images en mouvement: stockage, repérage, indexation. Sainte-Foy : Presses de l'Université du Québec, 1998. xiii, 102 p. (Gestion de l'information).
Turner, James M. "Metadata for moving image documents". In: Williams, Martha E. Proceedings of the 20th National Online Meeting, New York, May 18-20, 1999, p. 477-486. Medford, NJ: Information Today, c1999.
Turner, James M. ; Hudon, Michèle ; Devin, Yves. "Text as a tool for organizing moving image collections". In: CAIS 2000: Dimensions of a global information science: Canadian Association for Information Science: Proceedings of the 28th Annual Conference = ACSI 2000: Les dimensions d'une science de l'information globale: Association canadienne des sciences de l'information: travaux du 28e congrès annuel. (Page consultée le 29 avril 2001), [En ligne]. URL: http://www.slis.ualberta.ca/cais2000/turner.htm
EBSI > Cursus > Vol 6 no 1 > Chaperon | Dernière mise à jour : janvier 2002 |