Précédent Index Suivant

Tests d'interface homme--ordinateur avec le BioNetbook

[RE,LO]BioNetbook [RO,LE]

Cet article décrit les les résultats de tests effectués sur l'interface Web du BioNetbook au cours du mois de janvier 2000. Ces tests ont été réalisés avec 6 biologistes sur les terminaux X du Service d'Informatique Scientifique1.

Description du BioNetbook

Le BioNetbook est une base d'adresses de pages Web concernant la biologie (le nom vient de notebook qui veut dire carnet d'adresses, net pour Internet et bio pour biologie). Sa première version consistait en une dizaine de pages HTML accessibles à partir d'une page de menu intitulée Biologie Moléculaire sur le Web. Cette version a été complètement remaniée voici deux ans (Irène Wang, Catherine Letondal) pour transformer ces pages en base de données relationnelle. Cette base d'adresses contient à l'heure actuelle plus de 3 800 références classées selon différents critères (type de ressource, espèce ou organisme et domaine biologique). Elle est également interrogeable par mot.

La base est régulièrement mise à jour et les nouvelles entrées sont consultables par le bouton Ajouts récents de l'interface Web.

Une notice d'aide http://www.pasteur.fr/recherche/BNB/francais/guide.html explique comment utiliser l'interface Web et donne de nombreux exemples d'interrogations.

http://www.pasteur.fr/recherche/BNB/

Séances de tests

Ces séances avaient pour but d'améliorer la lisibilité de l'interface Web (et non de refaire toute la conception), c'est-à-dire de faire en sorte que des biologistes, censés connaître les bases de Netscape, de l'Internet et ce qu'est un outil de recherche de mots, puissent comprendre le fonctionnement du formulaire. Il ne s'agit pas du tout de faire croire à quiconque que la recherche d'informations constitue une tâche facile, mais simplement de supprimer ce qu'on appelle la complexité accidentelle, due à des erreurs de conception de l'interface (exemple bien connu ici : depuis qu'il y a des formulaires pour lancer les programmes de biologie, comme ces formulaires suppriment pour une grande part la complexité sans intérêt de leurs interfaces originales, la complexité intéressante des logiciels devient plus accessible).

Plus concrètement, l'objectif est de mesurer la distance qu'il y a entre ce qu'est l'application et la manière dont elle est perçue par l'utilisateur. Pour le savoir, la méthode consiste à « faire parler » des personnes devant l'interface, et pour cela, le mieux est de les mettre à deux, chaque personne ayant une consigne --- non absolue --- comme par exemple : l'un donne des indications d'actions à suivre, tandis que l'autre raconte ce qu'il voit. Il y a des variantes en fonction du fait qu'une des personnes connaît déjà ou non l'application, etc... L'utilisation de l'interface commence en général avec une requête qui correspond au thème de travail d'une des deux personnes. Un court entretien préalable permet de déterminer des thèmes qu'on peut suggérer comme exemple pour démarrer. Exemples :

Résultats

Quelles données contient cette base, quelles recherches peut-on faire ?

La découverte la plus surprenante a été qu'en arrivant devant le formulaire, on pouvait croire qu'il s'agissait d'une base de données d'informations scientifiques : motifs de protéines, séquences d'ADN, articles scientifiques, etc... C'est ce qui explique des requêtes très spécifiques comme : « osmotic », « DT40 », « gallus-gallus », « TmHR3 tenebrio », « Cre/lox », ... Cela est dû en partie certainement à une méconnaissance des moteurs de recherche --- bien que ces mots donnent des résultats sur le moteur d'Expasy (voir par exemple, BioHunt, un excellent moteur de recherche pour la biologie : http://www.expasy.ch/BioHunt/ ) --- ou bien à la confusion entre base d'informations scientifiques et répertoire d'adresses. Mais surtout au fait que rien dans la page du BioNetbook n'indiquait de quoi il s'agissait : une base de données de pages Web. Un titre a donc été ajouté pour l'indiquer.

Le formulaire n'est pas toujours celui qu'on croit

La deuxième découverte un peu surprenante a été que la notice d'aide était perçue et donc utilisée comme un formulaire. Première remarque donc, la notice d'aide est vue ! Mais l'explication est que les biologistes sont habitués aux formulaires de recherche bibliographique et aux interfaces de recherche dans les banques de SRS, du NCBI et que dans ces formulaires, on accède souvent à la liste des valeurs, ou termes valides, en cliquant sur le nom du champ. Donc cliquer sur Types de ressources dans le formulaire du BioNetbook aurait dû conduire à la liste des termes possibles. C'était le cas dans la notice, d'autant plus que les termes étaient cliquables... mais pas tous ! J'ai donc eu cette réflexion : « ah là ce n'est pas un lien (par exemple la ligne "médecine" dans "domaine biologique"), donc ça veut dire qu'il n'y a rien dans la base sur ce sujet ». Deux types de solutions : soit supprimer tous les liens de la notice, soit faire en sorte qu'elle constitue un vrai formulaire. C'eût été dommage tout de même d'enlever les exemples cliquables de la page d'aide : on en a simplement mis plus, en mettant souvent le mot exemple et en mentionnant comment retourner au formulaire.

Des requêtes surchargées, trop précises

Le troisième gros problème --- qui était en réalité déjà connu --- est celui des recherches trop complexes : les requêtes sont souvent composées d'un mot, voire plusieurs, plus des critères de classification. On peut se dire que c'est parce que les gens se sentent obligés de cliquer partout, soit parce qu'ils pensent que plus ils mettent d'éléments de choix plus ils facilitent la tâche du moteur de recherche, soit parce qu'ils pensent intuitivement un OU plutôt qu'un ET (ils augmentent les résultats au lieu de les restreindre). Les séances de tests n'ont pas apporté d'informations supplémentaires à ce sujet à ceci près que les deux dernières séances ont été faites avec un nouveau formulaire qui sépare 3 types d'accès : Cette approche s'est révélée plus claire (on voit qu'elle ne supprime aucunement la complexité mais qu'elle aide à la comprendre) et a donc été adoptée dans le nouveau formulaire. Par ailleurs, comme les recherches sont moins restrictives, l'utilisateur se retrouve moins souvent avec un résultat nul (et décourageant).

Manipulation des résultats, affinement de la recherche

Ordre des réponses

Il y a eu systématiquement des réactions concernant l'ordre d'affichage des réponses. Est-il alphabétique, ou, comme dans Blast ou Medline, selon un score ? Il était lexical par rapport aux URL's, ce qui a un intérêt limité, d'autant plus que l'URL n'était pas affiché (il l'est maintenant d'ailleurs, une suggestion de l'enquête en ligne) ; il est maintenant sur le titre associé à l'URL.

Voisinage

La classification des URL's faisant partie de la réponse est signalée en vert dans les réponses : tout le monde a voulu cliquer, mais... ce n'était pas cliquable. Encore une fois, on peut y voir le syndrome du cliquodrome planétaire. Ceci étant dit, c'est vrai qu'il n'est pas inintéressant de pouvoir parcourir des ensembles de résultats de proches en proches. Exemple, j'ai demandé les rubriques : Homo Sapiens + génomique. Parmi les réponses, celle-ci :

Banque du DOE des sujets et méthodes de recherche sur l'homme

classification : bibliographie, Homo sapiens, génomique

http://www.gdb.org/HTB/htb.html

est classée : Homo Sapiens + génomique + bibliographie ; j'aimerais maintenant lister tous les URL's qui ont la même classification (c'est analogue à la notion de voisinage dans Entrez --- http://www3.ncbi.nlm.nih.gov/Entrez/index.html ).

0.0.1   Des solutions alternatives quand on ne trouve rien ?

Puisque il arrive parfois qu'on ne trouve pas ce qu'on cherche (c'est actuellement le cas pour 33% des questions), un pointeur vers d'autres moteurs de recherche était systématiquement proposé. En cliquant sur ce lien, on trouvait tout ce qui était répertorié dans le BioNetbook comme « liste de ressources » et comportant l'expression « moteur de recherche » dans sa description. Malheureusement, ce pointeur a été compris par tous les testeurs --- et c'est donc probablement vrai pour d'autres utilisateurs invisibles --- comme voulant dire continuation de la recherche par d'autres moteurs.

Il est vrai que la possibilité d'affiner une recherche est assez habituelle dans les interfaces Web des banques bibliographiques, et était attendue ici aussi. Mais cette fonction n'existe pas dans le BioNetbook, car, comme tous les résultats sont disponibles en une seule fois dans la page, il suffit tout simplement d'utiliser la fonction de recherche de texte du navigateur, comme la fonction Find de Netscape (qui a été expliquée aux testeurs).

Surprises agréables

Les réactions des biologistes par rapport au contenu de la base on été souvent positifs car les tests leur ont permis de découvrir des sites parfois proches de leur thématique de recherche, qu'ils ne connaissaient pas, ainsi que de prendre un peu de temps pour aller rapidement jeter un oeil sur des serveurs qui n'avaient rien à voir avec la requête mais qui leur seraient utiles. C'est aussi une des fonctions d'une base de signets (bookmarks). Dans l'ensemble ils ignoraient qu'autant d'informations étaient à leur disposition.

Terme de recherche, troncature, langue d'interrogation

Types de problèmes rencontrés :

Termes composés

Les requêtes sont assez souvent composées de plusieurs mots, ce qui, comme le langage de requête proposé pour l'instant n'inclut pas les expressions booléennes, réduit beaucoup les résultats. L'interface propose déjà depuis un moment une décomposition des mots de la requête dans la page des résultats. Exemple, si on a demandé « primer design » et qu'on n'a rien trouvé, le serveur propose une recherche sur « primer » et sur « design » : il suffit de cliquer sur l'un des deux. Un langage booléen pourrait être envisagé assez rapidement, je ne sais pas trop ce que ça implique comme complications... (c'est du SQL derrière après tout, ça devrait être très faisable).

Troncature

Jusque-là, la troncature à gauche et à droite était automatique : pour des recherche comme "pI" (point isoélectrique), ou "NK" (natural killer cells), le résultat était mauvais, puisque on obtenait tous les mots contenant "pi" ou "nk". SQL, le langage de requêtes utilisé, ne permet pas des recherches avec des contraintes sur les frontières de mots, mais un post-traitement des résultats est possible.

La vraie question, c'est le type d'interaction proposé : faut-il fournir une case à cocher mot exact (suggestion d'une des testeuses, par comparaison à Word), et si cela n'est pas demandé effectuer une troncature des deux cotés ? Faut-il supposer une troncature explicite à droite : protoco* mais implicite à gauche ? (dans SRS, c'est un vrai problème, les gens ne comprennent rien à cette option, on le voit nettement dans les cours d'informatique). Une modification a été effectuée, qui semble être bien comprise : une case à cocher propose de choisir une recherche du mot exact : dans ce cas, aucune troncature n'est effectuée sur le mot. Par ailleurs, la page des résultats affiche le terme recherché en gras.

Langue d'interrogation

La langue d'interrogation, depuis l'interface en français, paraît être le français, et cela est trompeur. Mais, même si le travail gigantesque de traduction complète et correcte du BioNetbook pouvait être fait, les questions portent aussi sur les mots composant les URL's qui, eux, sont quasi systématiquement en anglais. Il n'y a pas vraiment de solutions, à part supprimer la version française. Pour l'instant, le serveur affiche un message en cas d'échec (0 réponses) : essayez le terme en anglais. Le serveur propose aussi d'essayer un mot plus court et d'essayer un mot plus général, ou bien de changer la troncature.

Éléments obscurs dans l'interface, termes techniques mal compris, suggestions d'améliorations diverses

Éléments de l'interface non utilisés, non perçus :

Bouton ET/OU : le connecteur booléen était en boutons de radio : on ne le voyait pas bien (c'est remplacé un petit menu).

Bouton RESET : pas vu du tout, en tous cas pas utilisé. J'ai mis "EFFACER" en majuscules à côté de "CHERCHER" (et ``SEARCH/CLEAR'').

Termes incompréhensibles :

- « liste de ressources » : ce terme n'a été compris par aucun des testeurs ; alternatives proposées :

Éléments de l'interface mal compris :

Une certaine confusion avec le style d'interaction Macintosh pouvait être remarquée, ainsi qu'une méconnaissance relative du navigateur (Netscape). Notamment, les listes à sélection multiple posent des problèmes ennuyeux : Ou bien encore, certains testeurs supposaient que, comme sur un Macintosh, une nouvelle sélection efface les précédentes - ce qui n'est pas le cas là puisque que la liste de rubriques proposées par le formulaire est une liste à choix multiple.

Remarques diverses

Bien que cela nous avait semblé - depuis la refonte du BioNetbook il y a deux ans avec Irène Wang, constituter un des problèmes délicats de cette base de données, il y a eu assez peu de réflexions et de remarques sur les critères de classification choisis. À part la rubrique « biologie cellulaire » qui semble manquer vraiment, il y a eu aussi une remarque sur le fait que le moitié des bookmarks classés en « immunologie » concernait HIV.

Enfin, dernier point de détail, la mention : « pour ajouter un URL au BioNetbook contacter : help@pasteur.fr », qui s'adresse à des personnes qui sont plutôt à l'aide avec le Web, apparaissait inopinément et trop prématurément en haut de la page des résultats (c'est maintenant en pied de page).

Résultats des améliorations de l'interface Web

Les chiffres sont calculés sur une période de deux mois s'étendant de mi-février à mi-avril 2000. Le nombre de requêtes par jour a quadruplé par rapport à la période précédant les tests ; il est actuellement de 360 par jour. Cela peut s'expliquer par d'autres facteurs, notamment par le fait que la base de données est aujourd'hui référencée sur plus de 250 sites spécialisés en biologie. Une optimisation du temps de réponse (modification indépendante des tests dont il est question ici, mais effectuée à la même époque) peut également expliquer une utilisation plus enthousiaste : en moyenne, le temps de réponse de la base de données est de : 4.5 secondes (ce qui ne comprend pas le temps de formattage des résultats et d'affichage par le navigateur).

L'augmentation du nombre de requêtes peut encore s'expliquer par deux autres facteurs : la notice d'aide comporte beaucoup plus de liens hypertextes qui sont autant de requêtes effectuées sur la base de bookmarks d'une part et la classification des URL's de réponses est devenue cliquable (recherche des réponses voisines).

L'effet des changements dans l'interface effectués d'après les informations recueillies lors des tests se voit probablement plus à la proportion de questions sans réponses qui a diminué (33% au lieu de 42%). En particulier, la médiane a changé : alors que 50% des questions obtenaient auparavant de 0 à 2 réponses, 50% des questions obtiennent actuellement de 0 à 10 réponses.

Le changement le plus visible pour l'utilisateur était la séparation des types de recherche en recherche par mot ou bien recherche par rubriques.

Nombre total de questions 21188
Nombre total de recherches de mots 10421
Nombre total de recherches par rubriques 7806
Nombre total de recherches combinées 1411
[pour la période mi-février mi-avril]  
On voit d'après le tableau que la majorité des requêtes effectuées sont des recherches de mots. Les recherches combinées, qui constituaient avant la grande majorité des cas de par une mauvaise lisibilité de l'interface Web, sont maintenant très minoritaires.

Conclusion

Notre objectif est de faire de cette base de bookmarks un outil pratique pour les biologistes du campus. Nous espérons donc que les améliorations apportées en fonction des tests ergonomiques auront été utiles. Un suivi régulier des journaux d'utilisation permet d'orienter le contenu de ce carnet d'adresses du Net en fonction des thèmes intéressant les chercheurs. Pour cette raison, n'hésitez pas à nous communiquer vos suggestions, soit en termes de nouvelles adresses, soit concernant l'interface d'interrogation.



Catherine Letondal



Édité par :
Service Informatique Scientifique
Institut Pasteur
28 rue du Docteur Roux
75724 Paris CEDEX 15
Tél. : +33 (1) 45 68 85 10
Fax. : +33 (1) 40 61 30 80
Câble : mcb@pasteur.fr

Les contributions et suggestions
sont à adresser à :
Laurent Bloch   bloch@pasteur.fr
Directeur de la publication :
Philippe Kourilsky
ISSBN : 1244-524 X

Copyright © Institut Pasteur 2000






Précédent Index Suivant