La bibliométrie se définit comme l'exploitation statistique des publications.
Cette analyse permet de rendre compte de l'activité des producteurs (chercheur, laboratoire, institut...) ou des diffuseurs (périodique, éditeur...) de l'information scientifique, tant d'un point de vue quantitatif que qualitatif.
Quantité et qualité : deux approches distinctes.
Dans les deux cas, les techniques utilisées de dénombrement et d'exploitation statistique
sont les mêmes. Cependant, elles aboutissent à des types de traitements et donc à des résultats différents : d'une part à des indicateurs qui permettent des comparaisons quantitatives entre des
ensembles de publications caractérisés, d'autre part à des ensembles relationnels destinés à cartographier, de façon figée ou
évolutive, les domaines couverts par des ensembles de publications.
Quelques applications de la bibliométrie : évaluer le travail d'un chercheur (y compris auto-évaluation...) ou le définir par analyse sémantique (d'un chercheur ou d'un groupe de chercheur, d'un centre, d'un pays...) évaluer le fonds de périodiques d'une bibliothèque suivre l'évolution d'un thème de recherche apprécier l'impact d'un article évaluer la qualité d'une revue...
Les moyens de la bibliométrie
Les publications, pour une grande part, sont référencées dans des bases de données bibliographiques, aujourd'hui informatisées; ce qui permet des recherches rapides, selon des critères multiples, sur d'importants volumes de références.
Le choix des bases de données desquelles vont être extraites les références est essentiel : il détermine quel type d'information va être analysé.
Les outils informatiques :
Un tableur (type Excel) peut suffire pour réaliser des analyses bibliométriques de base. Il faut pouvoir : importer des références depuis une base de données faire des tris et des comptages faire des exploitations graphiques
L'analyse de corpus complexes (par la méthode des mots associés par exemple) nécessite des logiciels spécifiques tels que Leximappe ou Dataview.
Les bases de données
Chaque base de données possède ses propres spécificités. Les références qui y sont regroupées sont sélectionnées selon des critères variables, en fonction des buts visés et des publics auxquels elles sont destinées.
Principaux critères : la couverture (domaine, zone géographique, type de publications, langues, nombre de sources dépouillées...) la forme et l'organisation de l'information (organisation en champs, nombre de champs,
présence d'une indexation...)
En cas de traitement ultérieur par un logiciel spécifique, il faudra veiller à ce que les structures des références des différentes bases interrogées soient compatibles entre elles, mais également avec le logiciel utilisé. Sinon, il faudra procéder au reformatage des données.
Bases de données spécifiques
Les bases de brevets constituent un cas à part. L'étude des brevets publiés est utilisée plus particulièrement en veille technologique dans un contexte de concurrence économique.
Page d'information de l'ISI : Accès au Web of Science réservé depuis le campus :
Base bibliographique multidisciplinaire et internationale en sciences et techniques. A ce jour sur le Web, les références remontent à 1945. L'abonnement de notre médiathèque démarre avec les références indexées à partir de 1971.
La mise à jour est hebdomadaire et 5900 journaux sont analysés. Il permet des recherches générales (par auteur, titre, mot-clé, etc...) et des recherches sur les références citées (bibliographies).
Les nouveautés 2004 incluent des fonctions d'analyse des résultats et des alertes sur les citations.
par domaines (désignés par l'ISI) par fréquence de citations : nombre de fois où sont cités les articles publiés par un périodique par facteur d'impact : rapport, pour une année donnée, entre le nombre de citations des articles publiés par un périodique et le nombre d'articles publiés, le tout sur une période de deux ans.
Calcul de l'Impact Factor de la revue Nature pour 1994 (d'après le Journal Citation Reports on CD-ROM) :
par "indice d'immédiateté" (immediacy index) : rapport pour une année donnée entre le nombre de citations recueillies et le nombre d'articles publiés par un périodique.
Calcul de l'Immediacy Index de la revue Nature pour 1994 (d'après le Journal Citation Reports on CD-ROM) :
D'autre indices de classement, plus complexes, sont également proposés (le Cited Half-life, et le Citing Half-life).
Quelques applications simples de la bibliométrie
Suivi de l'évolution d'un thème de recherche au cours du temps. Exemple : Ebola
Méthode : comptage des articles publiés sur le sujet, exploitation graphique sous Excel.
Base interrogée : Medline (domaine médical et biomédical) de 1978 (apparition des
premières publications) à fin 1996.
Commentaires :
Identifié pour la première fois sous le nom de maladie de Marburg en 1967. L'histoire de l'émergence et de l'identification du virus Ebola est relativement complexe.Cette brève étude ne tient compte que des mots-clés de Medline décrivant exactement cette maladie. Cependant le terme "ebola" se retrouve 3 et 12 fois dans des titres d'articles en 1977 et 1978, ce qui fausse le résultat. Un premier descripteur (Ebola virus) apparaît en 1980, et un second (Hemorrhagic Fever, Ebola), en 1996. L'analyse sémantique d'un sujet dans une base de données est donc indispensable à toute interrogation, particulièrement pour les études bibliométriques.
On notera surtout le pic de 1995, consécutif aux épidémies de novembre 1992 et 1994.
Méthode : comptage, dans la base Science Citation Index (début : 1980), du nombre de fois où un article est cité par un auteur, année par année. Exploitation graphique sous Excel. Attention : pour 1996, à la date d'interrogation, toutes les références de cette année n'était pas encore intégrées dans la base, ce qui explique les plus faibles valeurs systématiques. Attention : les commentaires proposés sont très succints et très généraux. Une juste interprétation des résultats ne peut être faite qu'en ayant une bonne connaissance des domaines concernés et de l'environnement scientifique qui les accompagne. Ils ne sont donc cités qu'à titre d'exemple.
Article 1, in Genetics, 1974. Nombre d'articles citants par année.
Pour cet article de 1974, on ne possède de données qu'à partir de 1980. Notons cependant la rapide décroissance du nombre de citations après cette date, qui peut caractériser un sujet ou la descrition d'une technique tombés en désuétude.
Article 2, in Nature, 1982. Nombre d'articles citants par année.
Ici, le sujet traité en 1982 est toujours d'actualité. Cependant, et logiquement, l'influence de l'article décroit régulièrement.
Article 3, in EMBO Journal, 1984. Nombre d'articles citants par année.
Il s'agit probablement ici d'un article faisant référence dans son domaine, voire "fondateur", qui est repris sytématiquement dans les bibliographies des articles parus sur le même sujet.
Article 4, in PNAS, 1982. Nombre d'articles citants par année.
Le pic de la fin des années 80 est dû à un mouvement de l'actualité qui illustre le côté aléatoire du devenir d'un sujet de recherche.
Quelques liens en bibliométrie et en scientométrie :