Le mouvement Wikimédia au Canada

La quantification du fossé des genres dans les ressources biographiques avec Wikidata

La quantification du fossé des genres dans les ressources biographiques avec Wikidata

Marie D. Martel

Simon Villeneuve

Marie D. Martel, Simon Villeneuve, « La quantification du fossé des genres dans les ressources biographiques avec Wikidata », dans Jean-Michel Lapointe, Marie D. Martel (dir.), Le mouvement Wikimédia au Canada (édition augmentée), Les Presses de l’Université de Montréal, Montréal, 2025, isbn : 978-2-7606-5389-4, https://www.parcoursnumeriques-pum.ca/13-wikimedia/chapitre3.html.
version 0, 31/03/2025
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

À l’aide de la base de connaissances libre Wikidata, les auteurs ont analysé le contenu biographique en ligne de dizaines de dictionnaires et d’encyclopédies afin d’établir la proportion d’articles dédiée aux personnalités féminines et masculines et de quantifier la présence relative du fossé des genres (gender gap). Ce chapitre présente les résultats portant sur 80 publications totalisant un peu plus de 2 millions d’articles biographiques. En moyenne, il est possible de dénombrer une proportion de 14 % d’articles sur des personnalités identifiées comme femmes et 86 % sur des personnalités identifiées comme hommes.

En tant que source d’information, Wikipédia appartient à la catégorie des ouvrages de référence de type encyclopédique. L’encyclopédisme vise à « rassembler le plus grand nombre possible de savoirs, les mettre en relation, les transmettre, les partager, les soumettre à la discussion » (Melançon 2018). Depuis 2001, l’encyclopédie Wikipédia, qui est sous licence libre, a contribué à mettre en place le projet et le mouvement Wikimédia, lequel a engendré un écosystème de connaissances libres en ligne. Ces contenus permettent aujourd’hui de partager et de quantifier certaines informations qui étaient autrefois inédites, confidentielles ou disparates et de discuter à leur sujet.

L’ancrage culturel, les idéologies, les valeurs façonnent les encyclopédies de même que la représentation de la réalité et les connaissances qu’elles mobilisent ou légitiment (Rey 2007; McDowell et Vetter 2021). À cet égard, comme tant d’autres encyclopédies, Wikipédia est aussi réputée pour perpétuer des biais sexistes tant en matière de participation éditoriale que de couverture biographique, ce qui n’a pas manqué d’attirer l’attention des médias (Cohen 2011b; Nadeau 2017). Sans pour autant proposer de définition, Noam Cohen, dans le New York Times, suggère de définir le concept de « fossé des genres » à partir du cas de Wikipédia, qui tend à décourager les contributrices. Plus précisément, le fossé des genres, dans ce contexte, fait référence aux disparités en matière de participation, de contenu et de représentation entre les genres sur les différentes plateformes wikimédiennes. Sur Meta-Wiki, qui sert de plateforme de discussion pour les différents projets wikimédiens, deux types de fossé des genres sont décrits : « (a) un fossé des genres du contenu : Dans l'espace principal de contenu de nos wikis, plus de contenus sont dédiés aux hommes qu'aux femmes et (b) un fossé des genres de la participation : plus d'hommes que de femmes participent à la communauté Wikimédia créatrice de contenusMeta-Wiki. Fossé des genres. Wikimedia Foundation.↩︎ ».

Le nombre d’éditrices sur Wikipédia à travers les différentes versions linguistiques serait actuellement de 13 % en moyenne alors que celui des genres autres qu’homme et femme (cisgenre) serait de 4 %Wikimedia Foundation. (2023). Community Insights 2023 Report.↩︎ selon le Community Insights Report 2023 (Wikimedia Foundation 2023). Il semble également que, entre 2019 et 2022, la proportion des éditeurs actifs de genres autres qu’homme et femme (cisgenre) a doublé. Pendant ce temps, les proportions d’éditeurs hommes et femmes sont restées globalement les mêmes durant cette période, bien qu’il y ait eu une augmentation significative du nombre d’éditrices depuis 2019. Selon plusieurs études menées sur cette question, l’écart de la participation entre les genres se reflète dans les articles biographiques et leur contenu.

Dans ce chapitre, nous nous intéressons au fossé des genres touchant le contenu. Nous souhaitons présenter une méthode pour documenter les descriptions du genre à partir d’un échantillon de 80 ressources biographiques qui sont fortement liées sur Wikidata, la base de connaissances qui alimente Wikipédia. Cet exercice nous permettra de produire de nouvelles données sur le pourcentage de biographies consacrées aux femmes dans ces ressources, incluant des ouvrages de référence canadiens notables, ainsi que dans les projets Wikimédia tels que Wikipédia en français et en anglais, de même que Wikidata. L’analyse de ces données fera émerger certains constats, basés sur des données probantes, au sujet de la couverture biographique dans ces ressources en plus d’une interprétation actualisée du fossé des genres dans les ouvrages de référence. Cette quantification des articles biographiques est susceptible de contribuer à une meilleure compréhension du fossé des genres et à une conscience plus grande des inégalités de genre et du sexisme systémique dans le monde documentaire en particulier et la société en général.

La diversité de genre en question

Les préoccupations concernant la diversité sociale dans le projet Wikipédia, laquelle se manifeste par un déséquilibre dans la couverture thématique, ont été soulevées assez tôt par la communauté wikipédienne. Les participants et participantes au projet Wiki Countering Systemic Bias, lancé en 2004, s’inquiètent de la manière dont les intérêts et le profil sociodémographique des éditeurs et éditrices pourraient peser sur le contenu et engendrer des biaisWikipedia: WikiProject Countering systemic bias. Dans Wikipedia, The Free Encyclopedia. Le texte d’introduction rédigé au début du projet en 2004 est demeuré presque inchangé jusqu’à ce jour.↩︎ :

Le projet Wikipédia souffre de biais systémiques qui découlent naturellement des groupes démographiques de ses contributeurs, se traduisant par une couverture déséquilibrée de certains sujets, laissant ainsi des groupes démographiques moins représentés sans couverture adéquate […]. Ce projet vise à éliminer les lacunes, en termes de perspective culturelle, engendrées par ces biais systémiques, en se concentrant consciemment sur des sujets et des points de vue négligés dans l’ensemble de l’encyclopédie. [traduction]

Un des sous-groupes du WikiProject Countering systemic bias, le Gender gap task force, est actif depuis 2013, le WikiProject Gender studies depuis 2005 et le WikiProject Women in Red depuis 2015Wikipedia: WikiProject Countering systemic bias/Gender gap task force. Dans Wikipedia ; Wikipedia: WikiProject Gender studies. Dans Wikipedia ; Wikipedia: WikiProject Women in Red. Dans Wikipedia.↩︎. Ces projets visent, à travers diverses formes d’engagement, à éliminer les biais systémiques de genre. Au moins deux de ces projets ont des groupes correspondants dans Wikipédia en langue françaiseLe projet Les sans pagEs est la version en langue française de WikiProject Women in Red ; le projet Femmes est la version correspondant au WikiProject Gender studies. Les projets WikiProject Countering systemic bias/Gender gap task force et WikiProject Countering systemic bias n’ont pas d’équivalent en français.↩︎.

Dans un article publié en 2020, Pierre-Yves Beaudouin, qui est alors administrateur de Wikimédia France, rapporte que Wikipédia en langue française compte 591 491 biographies, dont 18 % sont consacrées aux femmesWikimédia France. (5 mars 2020). Biais de genre : Wikipédia, aussi imparfaite que la société. Les données récentes indiquent 19,975 % de femmes et 79,881 % d’hommes dans Wikipédia en français. Source : Humaniki: Exploring Wikimedia demography. Consulté le 10 juin 2024.↩︎. Il précise que l’information concernant plusieurs dictionnaires et encyclopédies dont les contenus sont harmonisés avec Wikipédia et Wikidata (la base de données qui alimente Wikipédia) permet de présenter des statistiques concernant la proportion de biographies dédiées à des femmes. Quelques exemples indiquent que la performance de Wikipédia en matière de biais de genre se compare à celle d’autres ressources biographiques de façon avantageuse dans certains cas ; mais toutes, précise l’auteur en guise d’explication, y compris Wikipédia, sont tributaires des inégalités existant dans la société. Il soutient qu’un des mérites de Wikipédia, et plus spécialement de Wikidata, réside dans l’opportunité technologique de quantifier les biographies de plusieurs ressources en produisant des statistiques sur les écarts de genre dans les contenus biographiques.

Tableau 3.1 - Statistiques sur la proportion de biographies dédiées à des femmes dans différentes ressources (image tirée de l’article de Pierre-Yves Beaudouin, CC BY-SA)

Crédits : Pierre-Yves Beaudouin

Du côté de Wikipédia en anglais, les chiffres s’avèrent comparables, quoique légèrement supérieurs : en juin 2024, on retrouve 398 298 biographies consacrées aux femmes, ce qui représente 19,8 % des 2 006 964 biographies de cette encyclopédie à ce moment sur Humaniki qui calcule le pourcentage des genres parmi toutes les biographies des différents projetsHumaniki: Exploring Wikimedia demography.↩︎.

À partir d’un échantillon de 80 ressources, dictionnaires et encyclopédies, incluant des ouvrages canadiens, nous souhaitons montrer comment Wikipédia et Wikidata peuvent enrichir notre compréhension d’enjeux sociaux, comme les inégalités de genre, malgré les limites qui les caractérisent en termes de biais de genre. Cette exploration quantitative sera conduite en investiguant les questions suivantes.

  1. Comment pourrait-on utiliser Wikidata pour quantifier les contenus de sources biographiques telles que les dictionnaires et les encyclopédies ?

  2. Quelles nouvelles données peut-on produire concernant la proportion de biographies consacrées aux femmes au sein de Wikipédia et d’autres ressources biographiques, grâce à Wikidata ?

  3. Quelles interprétations et comparaisons peut-on dresser au sujet de ces ressources biographiques en considérant, plus spécifiquement, les données liées aux publications canadiennes, et qu’est-ce que cette quantification nous apprend sur le fossé des genres dans ces ouvrages de référence ?

Notre recherche se situe dans le prolongement des travaux sur le contenu de Wikipédia et porte plus particulièrement sur le fossé de contenu lié à l’asymétrie de genre dans la couverture biographique des ouvrages de référence. À notre connaissance, aucune étude rigoureuse sur l’évaluation comparative de la couverture biographique des ouvrages de référence n’a été entreprise depuis les travaux de Reagle et Rhue (2011). De plus, nous proposons une méthode qui diffère de l’approche utilisée par Reagle et Rhue, laquelle repose principalement sur la méthode de la liste de vérificationLa liste de vérification constitue une approche mixte : elle est catégorisée comme qualitative, mais il s’agit d’une méthode dont les données sont principalement recueillies de manière quantitative pour être traitées au moyen d’une analyse statistique descriptive et inférentielle (Johnson 2018).↩︎. Cette dernière conduit les chercheurs à comparer la couverture en termes absolus des différentes sources biographiques, soit le ratio et le nombre respectif total de biographies d’hommes et de femmes. Elle leur sert aussi à comparer le comportement de Wikipédia et de Britannica relativement à différentes listes préétablies de personnes notablesPar exemple : Gale Biographical Resource Center, Wilson’s Current Biography Illustrated, American National Biography Online, Chambers Biographical Dictionary, le top 100 des personnes les plus influentes selon le magazine The Atlantic et Times (Reagle et Rhue 2011, 1144‑45).↩︎.

Notre approche, dans la foulée de recherches récentes (Klein et Konieczny 2015a, 2015b; 2018), s’appuie sur la capacité de Wikidata de mesurer l’écart entre les genres dans les sources biographiques qui sont harmonisées sur cette dernière. Comme nous le décrirons dans la section suivante, cette méthode nous permet d’évaluer le fossé des genres dans un ensemble plus étendu d’encyclopédies et de dictionnaires que Reagle et Rhue ne l’ont fait. Ces ouvrages proviennent de divers pays, dont le Canada. Cette méthode quantifie l’écart de manière relativement plus précise en comparant ces sources biographiques entre elles. Nous soulignons enfin la rareté de la production de la recherche en français dans ce secteur auquel nous contribuons ici.

Une méthodologie basée sur Wikidata

Comment utiliser Wikidata pour quantifier les contenus de sources biographiques (dictionnaires ou encyclopédies) ?

La proposition méthodologique constitue une première réponse aux questions posées dans le cadre de la présente recherche. Pour mener celle-ci, nous nous sommes intéressés au genre associé aux sujets des publications biographiques de dictionnaires et encyclopédies possédant des identifiants uniques (UIDPar exemple, chaque entrée de l’Encyclopédie canadienne (EC) est associée à un identifiant unique prenant la forme d’une série de mots. Il s’agit d’ajouter cette série de mots à la fin de l’URL – https://www.thecanadianencyclopedia.ca/en/article/ ou https://www.thecanadianencyclopedia.ca/fr/article/ – pour accéder à la ressource correspondante en anglais ou en français. Il est ainsi possible d’avoir accès, par exemple, à un article en français de l’EC sur Émile Nelligan avec l’identifiant unique emile-nelligan, qui donne https://www.thecanadianencyclopedia.ca/fr/article/emile-nelligan.↩︎) qui sont rattachés à des propriétés spécifiques dans la base de connaissances libres WikidataEn effet, les quelque 125 millions d’éléments (Q) de Wikidata, dont plus de 10 millions dédiés aux humains, sont reliés entre eux par une ou plusieurs des plus de 10 000 propriétés (P) sous la forme de triplets RDF. De ces propriétés, plus de la moitié sont consacrées à des UID de publications externes. Ainsi, selon l’exemple précédent, sur Wikidata, la propriété P5395 est dédiée aux identifiants uniques des entrées de l’EC. Cette propriété permet donc d’associer chaque notion de l’EC à l’élément équivalent de la base de connaissances libre. Par exemple, l’entrée Émile Nelligan de l’EC est associée à l’élément Q2392492 de Wikidata (élément dédié au poète) à l’aide de la propriété P5395.↩︎. Le contenu de Wikidata étant publié sous licence libre zéro (CC0), il est aisé de le parcourir, de le trier, de le réutiliser, de le modifier et de le publier de nouveau, selon des critères spécifiques à l’aide, notamment, du langage de requête SPARQLConsulter, par exemple, les dizaines de milliers d’éléments à propos de personnalités féminines ne possédant pas d’article sur Wikipédia en français, éléments recensés lors du Mois des femmes 2019.↩︎.

Ainsi, une première requête (figure 3.1) nous permet, en juin 2024, de recenser 465 propriétés distinctes reliées à des UID de publications contenant des articles biographiques grâce à leur classification utilisant l’élément de propriété Wikidata relative aux encyclopédies (Q55452870) ou aux sous-catégories de celui-ciListe de ces propriétés : w.wiki/37pf.↩︎. En éliminant d’abord les faux positifs manifestes, les doublons et les publications centrées sur le genre, nous avons sélectionné des publications dont l’échantillon compte au minimum 1 000 entrées en essayant d’assurer une couverture géographique mondiale. Ce critère quantitatif nous paraît représenter un certain seuil d’impact documentaire sur le Web ainsi qu’un échantillon statistique significatif.

Figure 3.1 - Première requête SPARQL sur Wikidata, visant à repérer les ressources biographiques


SELECT DISTINCT?property?propertyLabel ?propertyDescription

WHERE

{

 ?property rdf :type wikibase :Property ;

      wdt:P31/wdt :P279* wd:Q55452870 .

 SERVICE wikibase :label { bd:serviceParam wikibase :language “[AUTO_LANGUAGE],en"

}

Une seconde requête SPARQL sur Wikidata a été appliquée pour mesurer le fossé des genres biographiques (figure 3.2). Notre sélection finale comprend donc 80 publications issues de tous les continents, et pour lesquelles nous avons réalisé une évaluation quantitative du genre des biographies.

Figure 3.2 - Seconde requête SPARQL sur Wikidata, visant à quantifier le pourcentage de biographies liées à des femmes et à des hommes. La partie PROPRIÉTÉIDENTIFIANT est remplacée par le numéro de la propriété associée à l’identifiant de la publication analysée (par exemple, P1417 pour l’Encyclopaedia Britannica).


SELECT?sexe (COUNT(DISTINCT ?person) as?total)

WHERE

{

 ?person

    wdt :P31 wd :Q5 ;

    wdt :P21 ?sexe ;

    wdt :PROPRIÉTÉIDENTIFIANT publication.

} group by ?sexe

Il faut noter que pour la majorité des ressources concernées, l’échantillon associé à Wikidata qui les rassemble ne permet pas de quantifier de manière exacte le fossé des genres biographiques. Cependant, le suivi de l’évolution d’une cinquantaine de cas entre mars 2019Wikipédia:RAW/2019-03-01. Dans Wikipédia.↩︎ et avril 2021Wikipédia:RAW/2021-04-01. (2022). Dans Wikipédia.↩︎ révèle une tendance lourde sans changement significatif. Enfin, nous supposons que l’association des échantillons analysés n’a pas été faite expressément selon un critère de genre.

Le nombre total d’articles biographiques de chaque publication correspond généralement à celui donné par le site officiel de la publication. Ajoutons que si cette information est habituellement disponible pour les publications spécialisées en biographies, il en est autrement des publications généralistes. Pour la plupart de celles-ci, des données ont été déduites en explorant le moteur de recherche interne des sites concernés. Quelques autres ont été fournies par des personnes représentant les publications après les avoir sollicitées par courriel.

L’intervalle d’incertitude ne tient compte que de l’échantillon associé et représente une valeur maximale avec un niveau de confiance de 95 %. Ainsi, pour les échantillons correspondant à 100 % du contenu d’une publication donnée, il n’y a pas d’incertitude sur les pourcentages. Les résultats sont présentés dans la section suivante.

Le contenu entier des trois wikis étudiés est disponible pour l’analyse à l’aide d’autres requêtes SPARQL et du site Humaniki. Les chiffres donnés sont exacts, mais toujours provisoires considérant qu’il s’y ajoute du nouveau contenu biographique chaque heure. Ainsi, les chiffres donnés ici pour Wikipédia en français et en anglais sont tirés du contenu en juin 2024, alors que ceux de Wikidata proviennent du site Qlever utilisant une version (ou dumpUn dump de Wikidata est une version exportée de la base de données de Wikidata à un moment donné, utilisée pour des fins de recherche ou d’analyse. Source : Wikidata:Téléchargement de la base de données. Dans Wikipédia.↩︎) de Wikidata réalisé le 6 juin 2024Qlever, Université de Fribourg-en-Brisgau. À ce moment, environ 19 % des éléments humains de Wikidata n’avaient pas de genre enregistré. Cela entraîne donc une incertitude sur la proportion réelle de chaque genre sur ce site, bien que nous n’ayons pas de raison de croire que l’échantillon actuel ne soit pas représentatif de l’ensemble. Notons également que plus de 40 identités de genre sont utilisées sur Wikidata↩︎.

Des données plus précises concernant les biographies de femmes

Quelles nouvelles données peut-on produire, grâce à Wikidata, concernant la proportion de biographies consacrées aux femmes au sein de Wikipédia et d’autres ressources biographiques ?

L’objectif empirique de notre étude est d’évaluer le fossé des genres biographiques en considérant simultanément le nombre d’articles associés à des individus identifiés comme femme (F) et homme (H) dans l’échantillon de 80 ressources biographiques, encyclopédies et dictionnaires retenus. Le tableau qui suit présente les données pour ces ressources qui totalisent plus de 2 millions d’articles biographiques (2 014 479 articles).

Ces premiers résultats présentent ainsi des statistiques sur la répartition des genres dans ces diverses ressources biographiques en mettant en évidence le pourcentage d’articles associés à des individus identifiés comme F et H. L’échantillon présente en moyenne une proportion de 14 % d’articles biographiques sur des personnalités F et de 85 % sur des personnalités H.

Les deux plus importantes ressources biographiques, soit Deutsche Biographie (622 800 entrées) et China Biographical Database Project (417 931 entrées), rassemblent 1 040 732 articles, soit près de 50 % des articles de l’échantillon. Or, le fossé des genres est relativement moins accentué dans le cas de ces ressources – comparativement à d’autres – et surtout en ce qui concerne le Deutsche Biographie qui présente 20,8 % de biographies F. Si on exclut ces deux publications afin d’avoir une idée plus représentative de l’ensemble des publications analysées, nous obtenons un fossé des genres encore plus creux, avec 11 % de biographies de personnalités F et 88 % de biographies de personnalités H.

Quelles interprétations et comparaisons peut-on dresser au sujet de ces différentes ressources biographiques en considérant plus spécifiquement les données liées aux publications canadiennes, et qu’est-ce que cette quantification nous apprend sur le fossé des genres dans les ouvrages de référence ?

D’abord, quelques remarques au sujet des données présentées dans le tableau complet des ouvrages de référence (tableau 3.2). Les données encyclopédiques sur les biographies dans Wikidata varient d’une ressource à l’autre ainsi qu’en fonction d’un historique de développement allant de la saisie de données manuelles à l’importation en lot des bases de données qui sont de plus en plus répandues. En ce qui concerne l’Encyclopédie canadienne (EC) et le Dictionnaire biographique du Canada (DBC), nous avons réalisé une première analyse du contenu à l’automne 2018Villeneuve, S. (s. d.). PoV — Wikipédia.↩︎. Les chiffres ont peu évolué depuis, le contenu associé à Wikidata de ces publications n’ayant que peu progressé. Le fossé des genres constaté a ainsi varié d’environ 1 % pour les deux.

À noter également que nous analysons le contenu biographique de l’Encyclopædia Britannica (EB) et de l’Encyclopædia Universalis (EU) associé à Wikidata depuis décembre 2017Villeneuve, S. (s. d.). PoV — Wikipédia.↩︎. Les proportions données pour ces deux publications sont exactes au pourcentage près. Précisons que le nombre d’éléments associés à des identifiants de l’EB est beaucoup plus grand que le nombre de biographies dévoilé par les personnes représentant cette publication. Cela s’explique par l’association sur Wikidata des redirections d’URL de l’EBPar exemple, Gilles Vigneault possède un identifiant unique sur Britannica, mais celui-ci mène vers l’article French Canadian literature et non vers un article biographique dédié à Vigneault.↩︎.

Certaines bases de données montrent une plus grande disparité de genres, comme le Biographical Directory of the United States Congress avec seulement 3 % de biographies F, contre 97 % de biographies H. C’est aussi le cas du Dizionario biografico degli Italiani qui a une faible proportion de biographies F, équivalant à 4 %. D’autres offrent une représentation un peu plus équilibrée comme le Dictionary of New Zealand Biography avec 27 % de biographies F, et 73 % de biographies H. Un autre exemple, l’American National Biography dispose de 16 % d’articles portant sur des personnalités F et 83 % sur des personnalités H ; ce qui est au-dessus de la moyenne des biographies F contenues dans les ressources de l’échantillon.

Plus de la moitié de ces publications (44 sur 80, soit 55 %) contiennent 10 % et moins de biographies F. Le Dictionnaire biographique du Canada qui en compte 6 % se trouve dans cette catégorie. Un peu plus d’un tiers des ressources biographiques (25 sur 80), en possède entre 11 % et 19,9 %.

Aucune ressource ne présente 50 % d’articles biographiques F et seulement 10 en contiennent 20 % et plus (voir le tableau 3.2)Dans ce cas, nous avons arrondi les données de SIKART qui indique précisément 19,9 % d’entrées biographiques F pour l’inclure dans la liste de ces dix ressources détenant plus de 20 % d’articles biographiques F.↩︎. C’est Babelnet, TDV İslam Ansiklopedisi et le Dictionary of New Zealand Biography avec respectivement 45 %, 37 % et 27 % de biographies F ; ces ressources montrent la couverture biographique qui apparaît, de façon relative, la moins déséquilibrée de l’ensemble. La seconde ressource canadienne qui figure dans l’échantillon, soit l’Encyclopédie canadienne (EC), appartient à cette catégorie avec 21 % de biographies F.

Tableau 3.2 - Les dix ressources détenant plus de 20 % d’articles biographiques F avec la proportion correspondante
Biographie F Biographie H
Ressources biographiques (total) 14,4 % 85,2 %
BabelNet 44,7 % 55,1 %
Deutsche Biographie 20,8 % 79,3 %
Dictionary of New Zealand Biography 26,7 % 73,0 %
Encyclopaedia Itaù Cultural 22,6 % 75,9 %
Encyclopedia of Fantasy 21,2 % 78,0 %
L’Encyclopédie canadienne 21,4 % 78,5 %
La Documentation permanente 25,1 % 73,8 %
Notable Name Database 20,1 % 79,8 %
SIKART 19,9 % 73,2 %
TDV Islam Ansiklopedisi 36,7 % 63,2 %

Comment se comportent les trois ressources biographiques traditionnelles qui figurent communément dans les listes d’ouvrages de référence institutionnels français et anglais ou américains, soit l’Encyclopædia Britannica, l’Encyclopædia Universalis et l’Encyclopédie Larousse ? L’Encyclopædia Britannica (45 296 éléments associés) montre une sous-représentation des entrées portant sur des personnalités F (11 %) par rapport aux personnalités H (89 %). L’Encyclopædia Universalis (17 589 éléments) présente également une forte disparité de genre, avec une faible proportion d’articles portant sur des personnalités F (9 %) et 91 % sur des personnalités H. L’Encyclopédie Larousse (3 164 éléments) affiche une proportion similaire à celle d’Encyclopædia Universalis, avec 9 % d’articles biographiques F et 91 % d’articles biographiques H, soulignant un déséquilibre important entre les genres. Plus généralement, ces trois publications ont des résultats sous la moyenne (14 %) en termes de pourcentage de biographies F.

Par ailleurs, le pourcentage indiquant le fossé des genres dans les deux sous-classes de l’échantillon correspondant aux ressources biographiques de langue française et anglaise est relativement similaire : 14 % de biographies de personnalités F pour les premières et 13 % pour les secondesOn peut voir ci-dessous les tableaux qui présentent les résultats des ressources biographiques en langue anglaise et française de l’échantillon.↩︎.

Les trois wikis hébergés par la Fondation Wikimédia analysés se situent en haut de la moyenne du pourcentage d’articles biographiques F (14 %) dans les ouvrages encyclopédiques de l’échantillon. Wikidata se place en tête des trois avec un pourcentage de 21 % de contenus biographiques F par rapport à Wikipédia en français et en anglais (20 %) ; ceci est moindre toutefois que Babelnet (45 %), TDV İslam Ansiklopedisi (37 %) et le Dictionary of New Zealand Biography (27 %). On note également que, en nombre absolu, la couverture biographique de Wikipédia en français (712 906) est largement supérieure à la couverture de chacune des ressources biographiques françaises, et même à la plus considérable, qui est Who’s Who in France (24 513) ; à l’instar de Wikipédia en anglais (2 006 964) pour les ressources anglaises, qui dépasse de loin Britannica, qui compte 45 296 entrées.

Tableau 3.3 - Le fossé des genres biographiques dans les ressources Wikimédia
(juin 2024)
Biographie F Biographie H Bio autres genres
Ressources biographiques (total) 12,6 % 86,4 % Non disponible
en.wikipedia 19,8 % 80,0 % 0,13 %
fr.wikipedia 20,0 % 79,9 % 0,143 %
Wikidata 20,9 % 60,3 % 0,09 %

Nous constatons enfin que le pourcentage moyen de biographies F dans les publications analysées (14 %) se rapproche du pourcentage de participantes dans les projets Wikimédia, qui oscille entre 11 et 15 %. En d’autres termes, il semble que le fossé des genres biographique des publications analysées présente le même ordre de grandeur que le fossé des genres des contributrices et contributeurs aux projets Wikimédia.

Quelques éléments de réflexion et de discussion

Plusieurs recherches sur le biais de genre se sont intéressées à la participation, d’autres au contenu, certaines aux deux à la fois. Dans notre étude, nous avons exploré le fossé des genres dans le contenu d’un ensemble de ressources biographiques de type encyclopédique. À la différence des travaux précédents sur la couverture biographique de ces dictionnaires et encyclopédies, le fossé des genres a été quantifié en ayant recours à Wikidata, la base de données en ligne qui supporte Wikipédia. Grâce à cette méthode s’appuyant sur les données massives, nous avons pu mettre à jour la situation en matière de genre de 80 ressources biographiques totalisant plus de 2 millions d’articles, et ce, de manière rigoureuse, efficiente et robuste – des résultats qu’aucune méthode auparavant n’avait permis de produire. Ainsi, et comme le reconnaissaient déjà Reagle et Rhue, il n’y avait pas eu encore, jusqu’à ce jour, de comparaisons à grande échelle de la couverture biographique et du genre dans les ouvrages de référence, incluant Wikipédia, en 2011. Or, cette affirmation est toujours valable et c’est cette lacune que notre recherche vise à combler. À noter que les travaux de Reagle et Rhue avaient cependant comparé Wikipédia et Britannica avec six autres ressources biographiques couvrant quelques milliers d’articles.

Du point de vue méthodologique, le critère de sélection pour le choix des ressources biographiques que nous avons retenu – un seuil minimal de 1000 entrées – a contribué à réduire de manière significative l’échantillon à celles ayant le plus d’impact documentaire. Il a aussi assuré une plus grande précision des résultats, puisque l’alignement de ces ressources sur Wikidata était dans la plupart des cas très prononcé. Le nombre de ressources biographiques et d’articles impliqués dans l’échantillon a ainsi permis de détecter et de mieux établir une tendance qu’il serait difficile de nier désormais au sujet du fossé des genres et de la présence de biais sexistes systémiques à l’œuvre dans les ouvrages de référence de type encyclopédique. Les principaux résultats quantitatifs qui ont mis en évidence ces inégalités sociales de genre dans le domaine des savoirs encyclopédiques, sont de trois ordres et portent sur :

  1. Le fossé des genres dans les ouvrages de référence de type encyclopédique. La couverture biographique du genre indique une sous-représentation considérable des personnalités F, à l’échelle mondiale, avec une moyenne de 14 % d’articles biographiques concernant des personnalités féminines. En outre, plus de la moitié des ressources compte 10 % et moins de biographies F. On constate enfin que près de 88 % (87,5 %) des ressources encyclopédiques présentent moins de 20 % de biographies F.

  2. Le fossé des genres dans les ouvrages de référence de type encyclopédiques en anglais et en français. Dans l’ensemble, les ressources encyclopédiques anglaises et françaises se comparent à la moyenne. Parmi ces ressources, celles qui sont le plus généralement accessibles, soit l’Encyclopædia Britannica, l’Encyclopædia Universalis, le Larousse, se trouvent sous la moyenne, et deux d’entre elles se situent sous la barre des 10 %.

  3. Le fossé des genres dans les ouvrages de référence de type encyclopédique canadien. Parmi les dix ressources qui se positionnent le plus favorablement, on en compte trois en anglais, une exclusivement en français et trois autres multilingues ou bilingues, comme c’est le cas de l’Encyclopédie canadienne. Cette dernière se démarque de l’ensemble de l’échantillon avec 21,4 % de biographies F. Le Dictionnaire biographique du Canada, qui est également bilingue, fait plutôt partie de la catégorie des publications qui présentent le fossé des genres le plus accentué avec 6,1 % de biographies F.

  4. Le fossé des genres wikimédien. La comparaison entre la couverture biographique de ces diverses ressources et les trois wikis de la Fondation Wikimédia est avantageuse pour ces derniers. En revanche, les résultats confirment la constance et l’étendue du fossé des genres existant dans les contenus de type encyclopédique qui sont à la disposition des internautes.

Cette situation concernant le fossé des genres dans les ressources encyclopédiques n’est pas récente. Quelques auteurs et autrices ont déjà écrit au sujet des biais sexistes dans les encyclopédies. L’archiviste et féministe réputée, Mary Ritter Beard, avait produit en 1942 une étude intitulée « A Study of the Encyclopædia Britannica in Relation to Its Treatment of Women », dans laquelle ses collègues et elle soulignaient avec force qu’en termes de participation à la production des ouvrages de référence, les femmes étaient quantité négligeable, à l’inverse des biais et des lacunes identifiés en termes de contenu et dont le dénombrement s’avérait substantiel. Une autre étude dans les années 1990, celle de Gillian Thomas, a démontré que le traitement biographique des femmes les plaçait en position de figurantes dans une histoire de la connaissance humaine où même Marie Curie est surtout décrite comme l’épouse de Pierre Curie. Il est juste de constater, en particulier à la lumière des résultats de cette recherche, que la situation et les pratiques dans le domaine des ouvrages encyclopédiques ont peu évolué depuis l’époque de Beard ou de Thomas, et qu’elles apparaissent aujourd’hui essentiellement inchangées jusqu’à preuve du contraire. Tout en reconnaissant que Wikipédia continue la tradition des grandes encyclopédies qui a débuté avec Diderot et D’Alembert, sans laisser de côté ses objectifs ambitieux et une volonté de couvrir de manière exhaustive le savoir humain dans un projet quasi utopique, il faut aussi noter que cette encyclopédie en ligne perpétue certains préjugés sexistes qui existaient déjà dans ces œuvres plus anciennes. À première vue, ces biais existent en dépit même du principe de neutralité qui est pourtant un des piliers du projet Wikipédia.

Le principe de neutralité constitue un élément de réflexion pertinent qui est régulièrement mis en cause dans les discussions concernant le fossé des genres (McDowell et Vetter 2021). D’entrée de jeu, il importe de préciser que le principe de neutralité ne réfère pas à un principe d’équilibre (par exemple, s’il y a 50 % d’hommes et de femmes, il devrait y avoir 50 % de biographies pour chacun). Le rôle du principe de neutralité dans le fossé des genres est lié à sa fonction épistémique. Comme les cinq principes fondateurs de Wikipédia qui sont « impératifs et non négociables », celui-ci constitue un fondement « intangible », s’appliquant à tous les articlesWikipédia:Neutralité de point de vue. Dans Wikipédia.↩︎. Le principe de neutralité, auquel les contributeurs et contributrices réfèrent généralement par l’acronyme « NPOV » tiré de l’expression anglaise neutral point of view (point de vue neutre), affirme que :

​​ les articles ne doivent pas promouvoir de point de vue particulier. Parfois, cela suppose de mentionner plusieurs points de vue et de représenter chacun de ces points de vue aussi fidèlement que possible, en tenant compte de leur importance respective dans le champ des savoirs. Cela suppose également de fournir le contexte nécessaire à la compréhension de ces points de vue selon les sources qui les portent, et de ne représenter aucun point de vue comme étant la vérité ou le meilleur point de vue. Ces conditions permettent la vérification des informations en citant des sources faisant autorité sur le sujet (particulièrement dans le cas de sujets controversés)Wikipédia:Principes fondateurs. Dans Wikipédia. Dans Wikipédia.↩︎.

Ce principe, qui vise à ne pas promouvoir de parti pris, cherche fondamentalement à éviter les biais. Pour ce faire, il s’appuie sur deux autres règles : la vérifiabilité et l’interdiction de publier des travaux inédits. Ces conditions déterminent conjointement le contenu encyclopédique : « ce qui peut ou non être publié dans Wikipédia ». La première règle de la vérifiabilité exige que toute information doive, pour être utilisée, pouvoir être vérifiée par les lecteurs ou lectrices à l’aide d’une « source ou référence de qualité ». La seconde règle, qui interdit les travaux inédits ou les recherches personnelles, exclut plus précisément les « recherches qui n’ont jamais été publiées en dehors de Wikipédia ou bien qui représentent une “révolution” non encore connue ou débattue dans le domaine, une opinion “excessivement” minoritaire ou que l’on ne peut associer qu’à des sources jugées confidentielles et/ou peu fiables voire, plus simplement, des interprétations, déductions ou intuitions personnelles du rédacteur de l’articleWikipédia:Travaux inédits. Dans Wikipédia.↩︎ ». Ces trois règles sont aussi considérées comme codépendantes : elles « doivent être interprétées les unes par rapport aux autresWikipédia:Vérifiabilité. Dans Wikipédia.↩︎ » pour prescrire le contenu admissible et partant le savoir ou ce qui compte en tant que tel au sein de Wikipédia. Or, ces trois piliers qui forment une barrière contre la subjectivité et les biais tendent également à défavoriser de manière significative l’admissibilité des articles biographiques portant sur des femmes pour lesquelles, dans certains cas, des sources secondaires vérifiables ne sont pas disponibles ou qui sont, pour d’autres, insuffisantes; ce qui compromet d’autant les opportunités d’atténuer le fossé des genres. Le paradoxe, que l’on pourrait appeler le paradoxe du biais wikipédien, tient à ce que les dispositifs (NPOV, vérifiabilité, pas de travaux inédits) mis en place pour contrer les biais dans les pratiques contributives individuelles exposent l’encyclopédie et la rendent vulnérable aux biais systémiques qui ne peuvent être contrés même lorsque les personnes participantes sont conscientes de ceux-ci et souhaitent intentionnellement y remédier. Dans cette perspective, ce principe de neutralité semble plutôt constituer un obstacle pour l’objectif de réduction du fossé des genres.

Par ailleurs, et comme le souligne Tkacz (2014), cette conception de la neutralité vise également à préserver l’encyclopédie des luttes au nom de la vérité : « La neutralité [...] tente de mettre à distance les batailles concernant la vérité du monde extérieur, c’est-à-dire des contestations de la vérité qui ont lieu en dehors de l’enceinte de Wikipédia. » À ce titre, Wikipédia diffère des encyclopédies historiques qui n’échappent pas aux controverses de leurs époques et vis-à-vis desquelles les auteurs assument un point de vue qui fait autorité et qui reflète le plus souvent une vision du monde « relativement homogène » (Reagle 2013), cité dans Tkacz. C’est aussi pour mieux soutenir la collaboration et établir le consensus collaboratif que ce choix épistémique en faveur de la neutralité de point de vue a été initialement revendiqué :

Le concept de neutralité de point de vue, tel que je l’ai envisagé à l’origine, reposait sur l’idée d’un concept social, visant à aider les gens à mieux s’entendre afin d’éviter ou de contourner de nombreux débats philosophiques. Quelqu’un qui croit que la vérité est socialement construite, et quelqu’un qui croit que la vérité correspond aux faits de la réalité peuvent toujours travailler ensemble dans ces conditions [traduction] (Wales cité dans Reagle 2013).

À ce titre, comme le suggère Tkacz, ce ne sont pas seulement des batailles particulières au sujet de la vérité qui auront été abandonnées, mais bien la notion de vérité elle-même.

Si Wikipédia a abandonné la vérité du monde extérieur, ce projet n’aura pas été, pour autant, à l’abri de batailles et de controverses qui dépassent largement les débats et délibérations en matière de construction des savoirs. Dans les limites de ce qui relève de sa vérité internePar vérité interne, nous référons, à l’instar de Tkacz, à l’explicitation de la neutralité de point de vue qui sert de cadre de justification : « Aucun point de vue ne doit être présenté comme étant la vérité. Il ne faut jamais affirmer, sous-entendre ou même laisser croire qu’un des points de vue est d’une quelconque façon meilleure, égal ou moins bon qu’un autre. Ni imposer systématiquement un point de vue, en révoquant catégoriquement ce qui pourrait sembler divergeant de sa propre opinion (même si le point de vue que l’on voudrait imposer est scrupuleusement sourcé, ou trivialement répandu au sein de l’opinion publique). » Wikipédia:Neutralité. Dans Wikipédia.↩︎, des luttes se déroulent au quotidien, toutes aussi féroces que celles dont on voulait, vraisemblablement, se soustraire à l’origine. De nombreux débordements concernent des instances de biographies de femmes dont les sources secondaires vérifiables sont contestées. Ces controverses ne se résolvent pas toujours au bénéfice d’une délibération aboutissant à un consensus collaboratif suivant l’image idéalisée suggérée par Wales. Heather Ford (2015) a étudié les dynamiques à l’œuvre dans ces cas. Elle a montré que le processus de décision fonctionne en rhizome, dans les périphéries où est détenu le pouvoir de ce qui sera représenté dans Wikipédia. Or, ces wikipédiens, qui ne correspondent pas à l’image médiatisée des amateurs, disposent des savoirs et des savoir-faire spécialisés, ils « comprennent comment se comporter et parler selon le vocabulaire technique, symbolique et politique complexe de Wikipédia et ont tendance à l’emporter ». Plusieurs exemples illustrent comment ces pratiques ne sont pas avantageuses dans le cas de controverses liées à des biographies de femmes. En outre, comme le souligne Doutreix (2017), l’étude de ces controverses indique qu’elles procèdent au détriment des paroles expertes ou militantes.

On peut suggérer, par ailleurs, dans une perspective intersectionnelle, que la situation est aggravée lorsqu’il s’agit d’articles ou d’informations qui touchent des femmes qui combinent plusieurs motifs d’oppression tels que la race, la couleur ou l’origine ethnique. Cette situation pourrait affecter également des articles de femmes qui sont d’origine franco-québécoise ou franco-canadienne et dont les contenus sont remis en question dans les pages de discussion par des wikipédiens issus de la majorité sur fr.wikipedia, lesquels vont privilégier certaines idéologies sur le genre et aussi certaines sources au détriment d’autres qui sont associées aux cultures francophones « périphériques » ou n’ayant pas un statut reconnu, selon les normes admises par la majorité, dans la hiérarchie des sources. Cette hypothèse rejoint les constats de Heather Ford (2017) selon lesquels ces wikipédiens « servent également à réaffirmer les centres d’autorité traditionnels, tout en amplifiant les nouveaux centres de connaissance et en niant l’autorité des connaissances qui ne sont pas codifiées dans la pratique ». En d’autres termes, le cadre épistémique relié à la neutralité empêche la production d’articles portant sur des personnes identifiées comme femmes pour lesquelles des sources secondaires vérifiables ne peuvent être fournies, mais il apparaît également préjudiciable dans les discussions touchant des articles dont les sources secondaires vérifiables pourraient être considérées comme suffisantes, mais qui sont rejetés par les wikipédiens qui détiennent le pouvoir sur les représentations et, par conséquent, sur ce qui est tenu pour vrai dans Wikipédia .

Avant de conclure cette discussion, il nous faut encore formuler quelques remarques au sujet des limites de cette étude. Ainsi, le fait que la déclaration de l’élément de propriété Wikidata relative aux encyclopédies (Q55452870) soit volontaire constitue peut-être une limite de l’outil, puisqu’il est possible de catégoriser des ressources dont le statut de publication ou d’ouvrage de référence de type encyclopédique pourrait être remis en question – c’est le cas, par exemple, de l’agrégateur BabelNet ou du Notable Name Database. Cependant, il s’agit des seuls cas de l’échantillon dont le statut apparaît possiblement contestable.

Par ailleurs, l’approche synchronique utilisée pourrait représenter une autre limite de la stratégie développée. L’idée de base de l’analyse actuelle consiste à mettre en évidence le fossé des genres en fonction du contenu qui est présenté aux internautes par les différentes publications, donc le fossé pour lequel un effort de numérisation et d’accessibilité en ligne a été fait. Il serait fort intéressant d’analyser les données selon une approche diachronique en fonction des périodes historiques des personnalités concernées, surtout en considérant l’hypothèse d’une réduction du fossé des genres s’opérant dans les dernières décennies. L’outil Humaniki, par exemple, rend possible cette différenciation.

Toutefois, une des limites les plus préoccupantes de notre étude concerne son parti pris en faveur d’une conception binaire du genre. En mettant exclusivement l’accent sur le fossé des genres en tant que catégorie binaire (homme/masculin et femme/féminin), nous avons négligé le statut des identités non binaires. Cette conjecture contribue aux biais, aux discriminations et à l’invisibilisation systémiques que subissent les personnes s’identifiant comme non binaires ou non conformes à une conception binaire (personnes trans, intersexes, agenres, bispirituelles, gender queer, fluides, etc.)Voir wikimediaDE (2021, 26 décembre). Non-binary Gender Identities in Wikidata (enregistrement de WikidataCon 2021).
↩︎
. À ce titre, la définition même du fossé des genres est appelée à être réévaluée et étendue au-delà de l’approche fondée sur la conception occidentale binaire du genre.

Que faire maintenant ?

Faute de pouvoir intervenir directement de manière substantielle et radicale sur les biais systémiques en raison des obstacles épistémiques découlant du NPOV, quelles sont encore les options possibles pour atténuer, de façon relative, le fossé des genres ? Comme le suggère Beaudouin (2020), la production intensive de biographies de femmes qui respectent le critère de vérifiabilité, lequel requiert que toute information puisse être vérifiée par une source ou une référence de qualité, constitue une avenue pour réduire le fossé des genres. Le soutien et la participation à des initiatives telles que Les sans pagEs et les ateliers Art et féminisme, qui se déroulent un peu partout au Québec et au Canada, favorisent cette production de contenu. Il reste encore plusieurs dizaines de milliers d’articles à créer qui répondent à ces conditions et à ce régime.

De plus, on peut penser qu’il faut mettre en œuvre un chantier éditorial pour les articles biographiques de qualité touchant les femmes, qui présentent aussi une asymétrie de genre sur Wikipédia Sur Wikipédia en français, on compte actuellement 294 articles biographiques portant sur des personnalités H et 53 sur des personnalités F : w.wiki/3pYE↩︎. Toutefois, pour de nombreuses personnalités féminines, les sources qui permettraient de satisfaire le critère de vérifiabilité ne sont tout simplement pas disponibles. Une autre piste est alors celle de la production de connaissances en amont, comme il est suggéré du côté de Wikimédia France :

Décernez des prix, faites des portraits, rédigez des entrées de dictionnaires bibliographiques, ou publiez des articles de recherche et des monographies sur des femmes méconnues. Wikipédia pourra ensuite traiter du sujet en faisant le travail de synthèse et de diffusion des connaissancesBeaudouin, P.-Y. (2020). Biais de genre : Wikipédia aussi imparfaite que la société. Wikimédia France.↩︎.

Dans une perspective régionale, une autre action consiste encore à accroître la création de liens entre les ressources bibliographiques canadiennes, québécoises et françaises, et Wikidata. Ainsi, l’ajout récent de 329 entrées du Japanese Canadian Artists Directory sur Wikidata montre qu’on y retrouve une proportion de 51,4 % de personnalités fémininesLes chiffres sont disponibles via cette requête : w.wiki/AQvk.↩︎.

On peut espérer le lancement d’un mouvement pour lier les contenus de ces ouvrages de référence – comme ceci a déjà eu lieu dans le cas d’encyclopédies telles que Britannica – afin de pouvoir mieux évaluer le fossé des genres existant dans ces dernières et y puiser également du matériel de contribution pour Wikipédia. Nous pensons notamment à un effort de mobilisation autour des encyclopédies québécoises suivantes : Biographies canadiennes-françaises, le Dictionnaire des auteurs de langue française en Amérique du Nord, l’Encyclopédie du patrimoine culturel de l’Amérique française, en plus de celles comprises dans notre recherche, soit le DBC et l’EC.

Notre étude nous invite à renouer avec la conclusion suivante : dans l’environnement wikimédien et au-delà, le problème n’est pas fondamentalement relié à l’importance du fossé des genres, que ce soit en termes de couverture biographique ou de participation éditoriale, mais il réside plutôt dans ce déséquilibre manifeste relié au sexisme systémique. Comme le suggère Jemielniak (2016), Wikipédia reflète les préjugés et les biais présents dans la société, et le sexisme, accentué par la culture techno-informatique, s’avère l’un des plus puissants leviers. Des résultats comme ceux de la présente recherche peuvent contribuer à une nouvelle explicitation et une meilleure compréhension du fossé des genres et du sexisme systémique. Toutefois, et comme d’autres travaux l’ont souligné, il faut désormais, de manière urgente et consciente, s’intéresser aux biais de genre en lien avec d’autres biais sociaux, selon une approche non binaire et intersectionnelle, dans le cadre des prochaines recherches avec l’aide de nouveaux outils, mais aussi aux politiques wikimédiennes inclusives afin de réduire, dans une perspective plus large et fondamentale, les injustices épistémiques.

Remerciements

Nous tenons à remercier Michèle Lefebvre, bibliothécaire à BAnQ pour son aide et ses lumières au sujet des ouvrages de référence canadiens. Nous remercions également les wikimédiens TomT0m et Nicolas Vigneron qui ont développé plusieurs outils d’analyse d’éléments et d’articles wikis ainsi que le mathématicien Maxime André pour l’aide dans le traitement de certaines données. Merci enfin au wikipédien Cantons-de-l’Est et à Pierre-Yves Beaudouin pour la reprise et la diffusion des travaux réalisés antérieurement.

Références

Accéder à cette bibliographie sur Zotero

Beard, M., D. Edinger, J. A. Selig, et M. White. 1977. « A Study of the Encyclaedia Britannica in Relation to Its Treatment of Women ». In Mary Ritter Beard: A Sourcebook (Studies in the Life of Women), édité par Ann J. Lane, 215‑24. Schocken Books.
Beaudouin, Pierre-Yves. 2020. « Biais de genre : Wikipédia aussi imparfaite que la société ». Wikimédia France. https://www.wikimedia.fr/biais-de-genre-wikipedia-aussi-imparfaite-que-la-societe/.
Cohen, Noam. 2011a. « Define Gender Gap? Look Up Wikipedia’s Contributor List ». The New York Times, janvier. https://www.nytimes.com/2011/01/31/business/media/31link.html.
———. 2011b. « Wikipedia Ponders Its Gender-Skewed Contributions ». The New York Times, janvier. https://www.nytimes.com/2011/01/31/business/media/31link.html.
Doutreix, Marie-Noëlle. 2017. « Quel dialogisme dans l’écriture encyclopédique de Wikipédia ? » In La reprise en actes, édité par Mari-Dominique Popelard, 149‑59. Presses universitaires de Rennes. https://doi.org/10.4000/books.pur.183897.
Ford, Heather. 2015. « Fact Factories: Wikipedia and the Power to Represent ». Doctorat, Université d’Oxford. https://ora.ox.ac.uk/objects/uuid:b34fdd6c-ec15-4bcd-acba-66a777739b4d.
Ford, Heather, et Judy Wajcman. 2017. « Anyone Can Edit”, Not Everyone Does: Wikipedia’s Infrastructure and the Gender Gap ». Social Studies of Science 47 (4): 511‑27. https://doi.org/10.1177/0306312717692172.
Jemielniak, Dariusz. 2016. « Breaking the Glass Ceiling on Wikipedia ». Feminist Review 113 (1): 103‑8. https://doi.org/10.1057/fr.2016.9.
Johnson, Peggy. 2018. Fundamentals of Collection Development and Management. American Library Association.
Klein, Maximilian, Harsh Gupta, Vivek Rai, Piotr Konieczny, et Haiyi Zhu. 2016. « Monitoring the Gender Gap with Wikidata Human Gender Indicators ». In Proceedings of the 12th International Symposium on Open Collaboration, 1‑9. Berlin Germany: ACM. https://doi.org/10.1145/2957792.2957798.
Klein, Maximilian, et Piotr Konieczny. 2015a. « Gender Gap Through Time and Space: A Journey Through Wikipedia Biographies and the "WIGI" Index ». arXiv. https://doi.org/10.48550/arXiv.1502.03086.
———. 2015b. « Wikipedia in the World of Global Gender Inequality Indices: What the Biography Gender Gap Is Measuring ». In Proceedings of the 11th International Symposium on Open Collaboration, 1‑2. San Francisco California: ACM. https://doi.org/10.1145/2788993.2789849.
Konieczny, Piotr, et Maximilian Klein. 2018. « Gender Gap Through Time and Space: A Journey Through Wikipedia Biographies via the Wikidata Human Gender Indicator ». New Media & Society 20 (12): 4608‑33. https://doi.org/10.1177/1461444818779080.
McDowell, Zachary J., et Matthew A. Vetter. 2021. Wikipedia and the Representation of Reality. Routledge.
Melançon, Benoît. 2018. « Les vertus utopiques de l’encylopédisme ». Sens public, 1059033ar. https://doi.org/10.7202/1059033ar.
Nadeau, Jean-François. 2017. « L’histoire invisible des femmes ». Le Devoir, mars. https://www.ledevoir.com/societe/493173/les-grandes-oubliees-l-histoire-invisible-des-femmes.
Reagle, Joseph. 2013. « Free as in Sexist?” Free Culture and the Gender Gap ». First Monday. https://doi.org/10.5210/fm.v18i1.4291.
Reagle, Joseph, et Lauren Rhue. 2011. « Gender Bias in Wikipedia and Britannica ». International Journal of Communication 5 (0): 21. https://ijoc.org/index.php/ijoc/article/view/777.
Rey, Alain. 2007. Miroirs du monde: Une histoire de l’encyclopédisme. Fayard.
Thomas, Gillian. 1992. A Position to Command Respect: Women and the Eleventh Britannica. Scarecrow Press.
Tkacz, Nathaniel. 2014. Wikipedia and the Politics of Openness. Chicago: University of Chicago Press.
Wikimedia Foundation. 2023. « Community Insights 2023 Report ». Wikimedia Foundation. https://meta.wikimedia.org/wiki/Community_Insights/Community_Insights_2023_Report.
———. s. d. « Humaniki Wikimedia Diversity Dashboard Tool ». Consulté le 27 février 2025. https://humaniki.wmcloud.org/gender-by-language.
Wikipedia. 2025. « Wikipedia:WikiProject Countering Systemic Bias ». Wikipedia, janvier. https://en.wikipedia.org/w/index.php?title=Wikipedia:WikiProject_Countering_systemic_bias&oldid=1270783007.

Contenus additionnels

WikiProject Countering Systemic Bias

En savoir plus sur le WikiProject Countering Systemic Bias.

Crédits : Wikipédia

Source

Tableau des résultats présentant la liste des ressources biographiques de l’échantillon avec la répartition des genres F et M

Incertitude (±)
Propriété Publication
  F
 M
Total F M
P4823 American National Biography 3141 15,9% 16512 83,4% 19799 0,51% 0,52%
P9629 Armeniapedia 212 13,4% 1363 85,8% 1588 1,67% 1,72%
P3218 Auñamendi Encyclopaedia 785 9,8% 7169 89,9% 7970 0,65% 0,66%
P1907 Australian Dictionary of Biography 1746 12,9% 11755 87,1% 13502 0,57% 0,57%
P10886 Austria-Forum person 327 14,8% 1830 82,6% 2215 1,48% 1,58%
P2581 BabelNet 4428 44,7% 5454 55,1% 9900 0,98% 0,98%
P9723 Base de données biographique des personnalités chinoises 294 10,1% 2110 72,4% 2913 1,09% 1,62%
P11014 Belarus in persons and events 347 14,0% 2120 85,7% 2474 1,37% 1,38%
P9160 Biografický slovník českých zemí 3155 8,3% 34450 90,8% 37935 0,28% 0,29%
P10033 biografija.ru 1299 8,0% 14958 91,9% 16270 0,42% 0,42%
P10713 biografiskt Lexikon för Finland 214 13,1% 1424 86,9% 1638 1,63% 1,63%
P1157 Biographical Directory of the United States Congress 426 3,3% 12546 96,7% 12972 0,31% 0,31%
P6234 Biographie nationale de Belgique 125 4,4% 2696 93,9% 2872 0,75% 0,88%
P5019 Brockhaus Enzyklopädie 2891 9,4% 27834 90,5% 30742 0,33% 0,33%
P3241 Catholic Encyclopedia 259 4,7% 5210 95,2% 5471 0,56% 0,56%
P497 China Biographical Database Project 49030 11,7% 368886 88,3% 417931 0,10% 0,10%
P1631 China Vitae 176 7,3% 2193 91,1% 2406 1,04% 1,14%
P8341 Dansk Biografisk Leksikon 948 9,9% 8640 89,8% 9621 0,60% 0,60%
P1988 Delarge 2528 18,1% 11310 81,2% 13936 0,64% 0,65%
P8313 Den Store Danske Encyklopædi 3324 12,3% 23740 87,6% 27103 0,39% 0,39%
P7902 Deutsche Biographie 12988 20,8% 493595 79,3% 622800 0,10% 0,10%
P7357 Diccionari de la Literatura Catalana 224 7,2% 2871 92,8% 3094 0,91% 0,91%
P4459 Diccionario Biográfico Español 1592 6,2% 22597 87,6% 25810 0,29% 0,40%
P2332 Dictionary of Art Historians (DAH) 233 9,6% 2195 90,3% 2431 1,17% 1,18%
P6829 Dictionary of Irish Biography 948 12,3% 6752 87,5% 7719 0,73% 0,74%
P2745 Dictionary of New Zealand Biography 831 26,7% 2269 73,0% 3108 1,56% 1,56%
P2029 Dictionary Ulster Biography 167 10,3% 1437 88,8% 1618 1,48% 1,54%
P1648 Dictionary of Welsh Biography 213 4,7% 4356 95,3% 4569 0,61% 0,61%
P4991 Dictionnaire biographique de la Géorgie 841 14,2% 5071 85,8% 5912 0,89% 0,89%
P2753 Dictionnaire biographique du Canada (DBC) 332 6,1% 5021 93,0% 5400 0,64% 0,68%
P3217 Dictionnaire biographique suédois 542 7,1% 7124 92,9% 7667 0,57% 0,57%
P6342 Dictionnaire des Wallons 134 10,0% 1202 89,5% 1343 1,60% 1,64%
P902 Dictionnaire historique de la Suisse 1210 5,0% 22690 94,3% 24066 0,28% 0,29%
P1986 Dizionario biografico degli Italiani 1158 3,8% 29592 96,2% 30749 0,21% 0,21%
P1565 Enciclopedia de la literatura en México 325 22,8% 1081 75,9% 1425 2,18% 2,22%
P4399 Enciclopédia Itaú Cultural 1252 22,6% 4212 75,9% 5546 1,10% 1,12%
P1417 Encyclopædia Britannica (EU) 5101 11,3% 40137 88,6% 45296 0,29% 0,29%
P3219 Encyclopædia Universalis (EU) 1545 8,8% 16030 91,1% 17589 0,42% 0,42%
P4228 Encyclopedia of Australian Science 599 15,9% 3115 82,8% 3760 1,17% 1,20%
P10883 Encyclopedia of Fantasy 257 21,2% 945 78,0% 1211 2,30% 2,33%
P6706 Encyclopédie De Agostini 1413 6,5% 20275 93,4% 21715 0,33% 0,33%
P10565 Encyclopédie de Chine 1185 8,3% 12137 85,3% 14231 0,45% 0,58%
P4613 Encyclopédie de l'Ukraine moderne 1892 16,0% 9910 83,9% 11811 0,66% 0,66%
P9475 Encyclopédie de la culture coréenne 105 4,9% 1895 88,1% 2152 0,91% 1,37%
P10789 Encyclopédie de la Lituanie mineure 102 8,0% 1171 91,7% 1277 1,49% 1,51%
P6858 Encyclopédie Larousse 280 8,8% 2883 91,1% 3164 0,99% 0,99%
P5002 Encyclopédie orthodoxe 124 4,1% 2929 95,8% 3056 0,70% 0,71%
P7666 Encyclopédie universelle lituanienne 1768 9,7% 16376 89,7% 18255 0,43% 0,44%
P12385 Gran Enciclopèdia Catalana 2496 7,6% 30372 92,4% 32881 0,29% 0,29%
P6412 Gran Enciclopèdia de la Musica 609 9,7% 5658 90,3% 6267 0,73% 0,73%
P11514 Grande Encyclopédie russe 930 8,4% 10184 91,5% 11125 0,51% 0,52%
P2924 Grande Encyclopédie russe en ligne 1437 7,6% 17476 92,4% 18913 0,38% 0,38%
P8406 Grove Art Online 1075 6,4% 15691 93,3% 16869 0,37% 0,38%
P7982 Hrvatska enciklopedija 1521 7,0% 20043 91,8% 21822 0,34% 0,36%
P7305 Internetowa encyklopedia PWN 2845 7,9% 33125 92,1% 35983 0,28% 0,28%
P8130 Internetowy Polski Słownik Biograficzny 815 7,2% 10497 92,8% 11311 0,48% 0,48%
P8590 Jewish Encyclopedia 136 4,7% 2755 94,9% 2903 0,77% 0,80%
P2180
Kansalis

biografia

974 15,9% 5148 84,1% 6122 0,92% 0,92%
P5395 L’Encyclopédie canadienne (EC) 913 21,4% 3346 78,5% 4265 1,23% 1,23%
P4434 La Documentation permanente 1904 25,1% 5597 73,8% 7580 0,98% 0,99%
P5035 Lambiek Comiclopedia 1048 1,2% 8067 85,8% 9399 0,64% 0,71%
P10242 Lur Hiztegi Entziklopedikoa 1115 8,5% 11953 91,4% 13078 0,48% 0,48%
P8998 Magyar életrajzi lexikon 922 7,0% 12313 93,0% 13234 0,43% 0,43%
P4724 Maitron en ligne 900 14,4% 5334 85,2% 6257 0,87% 0,88%
P3222 National encyklopedin 5153 14,4% 30594 85,5% 35784 0,36% 0,36%
P5080 Norsk biograpfisk leksikon 810 14,2% 4882 85,8% 5692 0,91% 0,91%
P1263 Notable Name Database (agrégateur) 7328 20,1% 29108 79,8% 36475 0,41% 0,41%
P8432 Österreichis- -ches Musiklexikon Online 991 13,2% 6487 86,6% 7488 0,77% 0,77%
P9106 Oxford Classical Dictionary 78 4,2% 1784 95,8% 1863 0,91% 0,92%
P9159 People Australia 3575 19,4% 13746 74,6% 18437 0,57% 0,63%
P5632 Persons of Indian Studies 81 3,8% 2040 95,8% 2129 0,81% 0,85%
P8349 Proleksis enciklopedija 771 6,8% 10561 92,5% 11419 0,46% 0,48%
P781 SIKART 2005 19,9% 7358 73,2% 10055 0,78% 0,87%
P1254 Slovenska biografija 886 9,8% 8161 90,2% 9047 0,61% 0,61%
P4342 Store norske leksikon 6288 15,0% 35480 84,9% 41782 0,34% 0,34%
P8081 système mondial d’information biographique 1322 9,1% 12870 88,6% 14518 0,47% 0,52%
P5184 TDV İslam Ansiklopedisi 1408 36,7% 2424 63,2% 3837 1,53% 1,53%
P5357 The Encyclopedia Science-Fiction 1844 18,3% 7795 77,5% 10058 0,76% 0,82%
P4124 Who's Who in France 3944 16,1% 20516 83,7% 24513 0,46% 0,46%
P4789 Who's Who UK 4287 15,6% 23082 84,2% 27401 0,43% 0,43%
Total 80 289727 14,4% 1716515 85,2% 2014479
Moyenne 3622 14,4% 21456 85,2% 25181
Total sans Deutsche et China 78 111409 11,4% 854034 87,7% 973748
Moyenne 1428 11,4% 10949 87,7% 12484
Projets wikis
Wikidata 2354205 20,9% 6793058 60,3% 11261683
Wikipédia en anglais 398298 19,8% 1606054 80,0% 2006964
Wikipédia en français 142405 20,0% 569480 79,9% 712906

Source

Tableau des publications anglaises (incluant les publications bilingues)

Incertitude (±)
Propriété Publication F M Total F M
P4823 American National Biography 3141 15,90% 16512 83,40% 19799 0,51% 0,52%
P1907 Australian Dictionary of Biography 1746 12,90% 11755 87,10% 13502 0,57% 0,57%
P1157 Biographical Directory of the United States Congress 426 3,30% 12546 96,70% 12972 0,31% 0,31%
P3241 Catholic Encyclopedia 259 4,70% 5210 95,20% 5471 0,56% 0,56%
P2332 Dictionary of Art Historians (DAH) 233 9,60% 2195 90,30% 2431 1,17% 1,18%
P6829 Dictionary of Irish Biography 948 12,30% 6752 87,50% 7719 0,73% 0,74%
P2745 Dictionary of New Zealand Biography 831 26,70% 2269 73,00% 3108 1,56% 1,56%
P2029 Dictionary of Ulster Biography 167 10,30% 1437 88,80% 1618 1,48% 1,54%
P1648 Dictionary of Welsh Biography 213 4,70% 4356 95,30% 4569 0,61% 0,61%
P2753 Dictionnaire biographique du Canada (DBC) 332 6,10% 5021 93,00% 5400 0,64% 0,68%
P1417 Encyclopædia Britannica (EU) 5101 11,30% 40137 88,60% 45296 0,29% 0,29%
P3219 Encyclopædia Universalis (EU) 1545 8,80% 16030 91,10% 17589 0,42% 0,42%
P4228 Encyclopedia of Australian Science 599 15,90% 3115 82,80% 3760 1,17% 1,20%
P10883 Encyclopedia of Fantasy 257 21,20% 945 78,00% 1211 2,30% 2,33%
P8406 Grove Art Online 1075 6,40% 15691 93,30% 16809 0,37% 0,38%
P8590 Jewish Encyclopedia 136 4,70% 2755 94,90% 2903 0,77% 0,80%
P5395 L'Encyclopédie canadienne (EC) 913 21,40% 3346 78,50% 4265 1,23% 1,23%
P1263 Notable Name Database (agrégateur) 7328 20,10% 29108 79,80% 36475 0,41% 0,41%
P9106 Oxford Classical Dictionary 78 4,20% 1784 95,80% 1863 0,91% 0,92%
P9159 People Australia 3575 19,40% 13746 74,60% 18437 0,57% 0,63%
P781 SIKART 2005 19,90% 7358 73,20% 10055 0,78% 0,87%
P5357 The Encyclopedia of Science-Fiction 1844 18,30% 7795 77,50% 10058 0,76% 0,82%
P4789 Who's Who UK 4287 15,60% 23082 84,20% 27401 0,43% 0,43%
Total 23 37039 232945 272711
Moyenne 1610 12,8% 10128 86,2% 11857

Source

Tableau des publications françaises (incluant les publications bilingues)

Incertitude (±)
Propriété Publication F M Total F M
P6234 Biographie nationale de Belgique 125 4,40% 2696 93,90% 2872 0,75% 0,88%
P1988 Delarge 2528 18,10% 11310 81,20% 13936 0,64% 0,65%
P2753 Dictionnaire biographique du Canada (DBC) 332 6,10% 5021 93,00% 5400 0,64% 0,68%
P6342 Dictionnaire des Wallons 134 10,00% 1202 89,50% 1343 1,60% 1,64%
P902 Dictionnaire historique de la Suisse 1210 5,00% 22690 94,30% 24066 0,28% 0,29%
P6858 Encyclopédie Larousse 280 8,80% 2883 91,10% 3164 0,99% 0,99%
P5395 L'Encyclopédie canadienne (EC) 913 21,40% 3346 78,50% 4265 1,23% 1,23%
P4434 La Documentation permanente 1904 25,10% 5597 73,80% 7580 0,98% 0,99%
P4724 Maitron en ligne 900 14,40% 5334 85,20% 6257 0,87% 0,88%
P781 SIKART 2005 19,90% 7358 73,20% 10055 0,78% 0,87%
P4124 Who's Who in France 3944 16,10% 20516 83,70% 24513 0,46% 0,46%
Total 11 14275 87953 103451
Moyenne 1298 13,6% 7996 85,2%

Source

Marie D. Martel

Marie D. Martel est professeure agrégée à l’École de bibliothéconomie et des sciences de l’information de l’Université de Montréal.