L’effet ISI de 1990 : une augmentation artificielle de l’intérêt pour un sujet scientifique

Voilà une aventure passionnante: R. Stuart Geiger s’intéressait à la littérature sur un logiciel de traitement d’enzymes et cherchait à savoir si une amélioration apportée à ce logiciel augmentait son utilisation pour la recherche sur les enzymes.

Le voici récupérant toutes les références de la base Thomson ISI avant et après 1990 contenant le nom du logiciel et le mot-clé « enzyme ». Et, en effet, on voit une augmentation spectaculaire à partir de 1990, du nombre de documents. Cherchant à savoir si cette augmentation pouvait avoir une autre cause – comme un regain d’intérêt pour les enzymes en général – il étudie un cercle plus large de publications et observe le même phénomène. Intrigué, il examine alors ce qui se passe pour des mots-clés correpondant à d’autres domaines de recherche. Et, à chaque, fois, c’est le même phénomène : stabilité, montée en flèche en 1990 et plateau.

Voici sa conclusion, fort convainquante et très éclairante:

The most likely situations would be that in 1990, 1 a large number of new journals most likely less popular ones were added, 2 new kinds of research materials books, conference proceedings, data sets, etc were added, or 3 ISI’s method for determining article topics was changed such as including author keywords or abstracts.  I suspect #3, and after far too much digging, I found some confirmation in a 1994 essay written by ISI’s founder:Through large test samples, we concluded that the titles of papers cited in reviews and other articles were sufficient to add useful descriptive words and phrases to the citing paper. This was later confirmed in studies by A. J. Harley, as Irv Sher and I recently reported.11, 12In 1990, ISI now Thomson Reuters was able to introduce this citation-based method of derivative algorithmic subject indexing, called KeyWords Plus®. 7, 8 In addition to title words, author-supplied keywords, and/or abstract words, KeyWords Plus supplies words and phrases to enhance these other descriptors and thereby retrievability. These KeyWords Plus terms are derived from the titles of cited papers, which have been algorithmically processed to identify the most-commonly recurring words and phrases.Unfortunately, this new algorithm for topic indexing appears to have been introduced without distinguishing it from the old one.  As far as I can tell, there is no way to just search for pre-1990 style keywords in post-1990 articles, meaning that ISI’s topics and keywords are useless for historical bibliometrics that span across this date.   And thanks to what I’m calling ‘the 1990 effect’ someone give me a better term, please!, many researchers are being led down a deceptively misleading path!

via Perils of Keyword-Based Bibliometrics: ISI’s ’1990 Effect’ | R. Stuart Geiger.

A propos docnews

Documentaliste, chef de projet, manager de l'information, curieux d'informatique documentaire
Cet article a été publié dans Bibliometrics, Scientometrics. Ajoutez ce permalien à vos favoris.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s