Autre commentaire sur l’analyse Wikipedia

En observant les 100 pages dans les trois classements encyclopédiques (nombre de révisions, nombre d’utilisateurs identifiés et longueur de la page pour l’espace de noms des pages encyclopédiques), j’ai été étonné par le type des pages présentes. Du coup, j’ai essayé de les classer par catégorie. Ce classement est purement subjectif et ne se base sur aucune (classification officielle. Je n’ai même pas utilisé les catégories Wikipedia officielles. Le schéma ci-dessous présente le résultat de ce petit travail. En rouge la proportion d’articles de qualité et en orange les bons articles.

La première constatation est que les pages les plus nombreuses sont celles concernant l’histoire et surtout la géographie (33 et 63 pages), et aussi le sport (26 pages), soit 122 pages sur les 221 sélectionnées (55,2%, et en particulier 43,4% pour l’histoire-géographie). Étonnement, la télévision, la musique, la religion et le cinéma sont plutôt peu présentes.

Une autre curiosité est la présence importante du catch dans les pages à caractère sportif. Bien après le foot, il concerne tout de même 7 pages (plus que le cinéma et autant que le religion…).

En histoire et géographie (et aussi dans d’autres classes), beaucoup de pages sont les «liste de…». Ceci s’explique aisément par le fait qu’un des trois classements concerne «les pages les plus longues», et la liste est un cas favorable pour ce classement.

A noter aussi, l’absence totale des bons articles ou d’articles de qualité sur la pages politiques et religieuses. Un hasard ? Des thèmes trop sensibles ?

En conclusion, les pages sélectionnées sont parfois assez étonnantes. Les classes majoritaires le sont tout autant. Il est évident que cette étude ne reflète par les proportions globales, mais seulement dans le cadre des pages longue et/ou avec beaucoup d’édition et/ou avec beaucoup de contributeurs.

Une nouvelle étude sera refaite dans quelques mois pour étudier l’évolution dans le temps.

NB : Les tableaux détaillant la classification sont consultables ici (en PDF).

Ce contenu a été publié dans Recherche, avec comme mot(s)-clé(s) . Vous pouvez le mettre en favoris avec ce permalien.

3 réponses à Autre commentaire sur l’analyse Wikipedia

  1. toutsexplique dit :

    Le poids du catch c’est l’effet traduction initiale des pages de la version de Wikipedia anglophone. Probablement au début pour gonfler le nombre d’articles, des contributeurs ont traduits de façon quasi automatique la version US. Ils n’ont pas fait de tri d’où les nombreux articles catch.

Les commentaires sont fermés.