Le mouvement Wikimédia au Canada

Le festival folk Mariposa et Wikidata au Canada 

Le festival folk Mariposa et Wikidata au Canada 

Un projet de données liées

Stacy Allison-Cassin

Traduit par Pierre Gabriel Dumoulin

Stacy Allison-Cassin, « Le festival folk Mariposa et Wikidata au Canada  », (traduit par Pierre Gabriel Dumoulin), dans Jean-Michel Lapointe, Marie D. Martel (dir.), Le mouvement Wikimédia au Canada (édition augmentée), Les Presses de l’Université de Montréal, Montréal, 2025, isbn : 978-2-7606-5389-4, https://www.parcoursnumeriques-pum.ca/13-wikimedia/chapitre4.html.
version 0, 31/03/2025
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

Le festival Mariposa, un événement majeur de la musique folk au Canada, se transforme en laboratoire de données ouvertes grâce à un projet de longue haleine piloté par Stacy Allison-Cassin de l’Université Dalhousie. Elle propose un retour critique sur cette initiative visant à rendre les archives du festival, qui s’étendent sur plusieurs décennies, accessibles au public via Wikidata, la base de données sémantiques multilingue et collaborative lancée en 2012 par la Fondation Wikimédia. En revenant sur les difficultés, les enjeux et les opportunités rencontrés en cours de route, l’autrice souligne l’importance de la représentation équitable des cultures qui composent le Canada, en particulier celles des peuples autochtones. En filigrane, on apprend également comment le milieu des archives et des bibliothèques s’est approprié Wikidata pour documenter sur le Web la diversité des arts et cultures au pays.

Offrir la possibilité de rendre les données disponibles, réutilisables et transparentes, d’une part, et assurer l’accessibilité des données financées par des fonds publics, d’autre part, sont des caractéristiques estimées essentielles dans une société civile équitable. Les chercheurs, les organisations et les institutions non gouvernementales sont invitées à rendre leurs données plus accessibles. Au Canada, depuis plusieurs années, de nombreux ordres de gouvernement s’efforcent d’augmenter la disponibilité et d’accroître la sensibilisation de la population aux relations entre les données ouvertes et une société engagée, informée, innovante et juste. Pour le gouvernement canadien, les données ouvertes « sont définies comme étant des données structurées, lisibles par machine, qui peuvent être librement partagées, utilisées et mises à profit par quiconque, sans restriction » (Statistique Canada 2023). En outre, il souligne que ces données offrent plusieurs bénéfices, comme l’innovation, la prise de décisions éclairée, la mise à profit des informations du secteur public, en plus d’accroître la responsabilité des gouvernements. Les critères qui rendent les données ouvertes – la structure, la lisibilité par machine, l’accès sans restriction – ne sont pas des éléments typiques des données commerciales exclusives, lesquelles ne sont généralement pas réutilisées en dehors des limites de leur organisation propriétaire.

Les bibliothèques, les archives, les musées, les galeries d’art, les centres culturels ainsi que d’autres organisations rattachées à la culture, ayant par exemple des projets musicaux ou historiques, se dotent également de mandats visant à avoir des impacts positifs sur la société canadienne. En général, ces organisations ont des besoins liés à la gestion de l’information et des données, plus particulièrement sur la gestion des collections de culture matérielle. Par conséquent, elles sont aussi très impliquées dans la création et la mise à jour de données structurées. Dans le cas des bibliothèques, des archives et parfois d’autres organisations, ces données peuvent être lues par des machines, en plus d’avoir été créées, conservées ou échangées selon des normes locales, nationales ou internationales. Habituellement, ces organisations ont également intérêt à créer leurs propres données, qu’il s’agisse de rendre des collections accessibles pour un fonds d’archives ou d’augmenter l’impact de la recherche d’une université. Partager, améliorer et rendre accessibles les données structurées sont d’excellentes façons d’atteindre ces plus larges objectifs organisationnels et sociaux. Le partage ouvert de données peut aussi aider à rendre la société plus juste et équitable en augmentant l’impact de la culture au Canada et à l’international, comme dans le cas des données ouvertes du gouvernement. L’intérêt croissant pour l’intelligence artificielle (IA) et pour les nouveaux modes de recherche et de découverte souligne la nécessité d’avoir de plus vastes jeux de données très structurées pour soutenir le développement continu en apprentissage automatique (machine learning) et l’innovation en matière de traitement (processing innovation). Bien que la création et l’utilisation de données structurées disponibles en libre accès aient été bénéfiques, beaucoup de bibliothèques, d’archives et d’organisations culturelles sont souvent confrontées à un manque de ressources techniques pour rendre leurs données ouvertement accessibles (Allison-Cassin et Scott 2018). De plus, de nombreux systèmes utilisés pour la gestion des collections au sein des organisations ne sont pas disponibles sur Internet, ce qui limite les possibilités de rendre les informations visibles et réutilisables associées aux collections et aux personnes qui créent du contenu culturel. Les données culturelles ne sont pas souvent des données ouvertes (Zhu et al. 2023).

Mon parcours dans Wikipédia et dans Wikidata a débuté par nécessité. En 2015, j’ai été nommée titulaire de la chaire W. P. Scott en bibliothéconomie numérique et j’ai commencé à mener un projet de recherche axé sur l’utilisation des technologies des données liées pour mieux décrire les matériaux musicaux (York University s. d.). Plus spécifiquement, je me suis intéressée aux matériaux du festival folk Mariposa (Allison-Cassin 2015; Proffitt 2018), l’un des plus anciens festivals de musique folk en Amérique et dont les archives sont conservées à l’Université York, dans les Clara Thomas Archives and Special Collections (St-Onge et Cohen-Palacios 2010/2024). À l’origine, mon plan de recherche était de recueillir le contenu des programmations du festival, les artistes, les lieux, les dates et les personnes organisatrices par exemple, sous la forme de données liées afin de tester les descriptions enrichies et de révéler comment les informations sont liées entre elles dans le festival. Puisque les méthodes standards de description en bibliothèque ne facilitent pas le traitement adéquat de la musique, hormis le genre classique, me concentrer sur la musique folk canadienne me semblait être une étude de cas idéale pour examiner les concepts associés au passage d’une focalisation axée sur les œuvres musicales à une focalisation centrée sur le réseau de relations au sein d’une scène culturelle (Allison-Cassin 2012). J’ai rapidement été confrontée à plusieurs défis dans le projet. Le premier problème était la grande difficulté causée par un accès inadéquat aux ressources pour créer et publier des données liées. Un second problème concernait mon désir d’intégrer le contenu de Wikipédia dans mon projet, notamment la biographie des artistes : très peu d’articles sur Wikipédia traitent des artistes ou des lieux associés au festival Mariposa ou du renouveau de la musique folk sur la scène torontoise. J’ai alors commencé à écrire des articles Wikipédia sur des personnes ou des lieux importants du renouveau de la musique folk à Toronto et au Canada, comme la Riverboat Coffee House (Wikipédia 2024). En voulant combler les lacunes sur le sujet, je me suis retrouvée de plus en plus impliquée dans l’utilisation de la plateforme et dans son soutien.

Dans ce chapitre, j’aborde plusieurs projets, initiatives et recherches dans le domaine des bibliothèques, des archives et des applications de données culturelles qui mobilisent la base de données Wikidata en contexte canadien. À partir de ces exemples, j’aborde les enjeux critiques de l’utilisation et du développement continu de Wikidata en tant que base de connaissances structurée ouverte et en libre accès au Canada, mais aussi les possibilités qu’une telle plateforme peut offrir. En tant qu’utilisatrice active et membre de la communauté Wikidata, j’adopterai une approche personnelle dans cette discussion, en me concentrant sur plusieurs thèmes et exemples. Pour une approche plus systématique de Wikidata, Zhao (2023) et Tharani (2021) ont publié des articles savants sur le sujet. J’ouvre ce chapitre sur mes débuts dans Wikidata avec le projet Music in Canada @ 150 ; les sections subséquentes suivront des regroupements par types d’activités.

En fin de compte, si Wikidata peut être utilisée pour soutenir des activités rattachées aux données culturelles et aux mécanismes et être employée pour rendre disponibles et accessibles les données structurées, il existe d’importants enjeux au sein de la plateforme Wikidata et de ses relations avec l’écosystème plus large qui doivent être pris en considération avant de mobiliser des ressources dans ce domaine. Au même moment, le besoin de développer une pratique éthique s’impose dans le paysage des données structurées afin de répondre à un large éventail de préoccupations, telles que les données autochtones, la vie privée et la discrimination. Pour plusieurs bibliothèques, archives et organisations, Wikidata offre un moyen de s’engager dans des projets qui visent à augmenter la visibilité des contenus sur des sujets canadiens. Cependant, des enjeux majeurs subsistent, comme le manque de soutien pour les données autochtones, la faible disponibilité des données et des contenus canadiens ainsi que les problèmes liés à la structure fondamentale du projet, et rendent improbable que Wikidata soit utilisée comme une source fiable de données ouvertes. Toutefois, compte tenu du rôle que jouent les données structurées dans le développement, actuel et à venir, de l’IA, Wikidata pourrait être appelé à devenir un acteur important de cette scène.

Contexte

Projet de Wikimédia lancé en 2012, Wikidata évolue rapidement en une source importante de données structurées gratuites et en libre accès sur Internet. Comme son nom l’indique, Wikidata est un projet qui crée et soutient le développement de données sémantiquement structurées en libre accès et auquel tout le monde peut contribuer. C’est un effort collaboratif semblable à celui de Wikipédia qui a un profond impact sur les lieux d’information et de connaissance, soulignant de fait l’importance de chaque contribution. Plateforme multilingue disponible gratuitement sous licence libre, Wikidata offre aux individus et aux organisations la possibilité de façonner les données structurées. Au Canada, Wikidata a trouvé sa place au sein de l’espace des données culturelles, s’alignant sur les objectifs organisationnels relatifs aux données ouvertes structurées (Allison-Cassin et Scott 2018).

Wikidata est décrit sur la page d’introduction au projet comme « une base de données libre, collaborative, multilingue, et secondaire qui collecte des données structurées pour alimenter Wikipédia, Wikimedia Commons, les autres wikis du mouvement Wikimédia et pour n’importe qui de par le mondeWikidata:Introduction. Dans Wikidata.↩︎ ». C’est une base de connaissances, un dépôt d’informations structurées qui sont lues et traitées par des machines. Plus spécifiquement, les données structurées sont des informations (données) hautement organisées qui peuvent être facilement exploitables par des machines, comme des adresses ou des dates de naissance qui ont été normalisées. En d’autres mots, chaque élément dans le jeu de données est défini et utilisé de la même façon. Les données non structurées, quant à elles, peuvent être difficilement mobilisées par des machines ou être réutilisées. Wikidata est déjà intégrée dans des applications ou des utilisations qui dépassent le cadre des projets Wikimédia. Contrairement à Wikipédia, la base de connaissances Wikidata est appréciée et valorisée pour ces utilisations « au-delà des projets » de Wikimédia, ce qui la rend unique parmi leurs projets.

À l’origine, Wikidata a été développé pour répondre aux enjeux techniques que rencontrait Wikipédia. L’encyclopédie en ligne compte de nombreuses versions linguistiques qui sont uniques, et « l’un des premiers objectifs de Wikidata était de soutenir Wikipédia en centralisant les données contenues dans les infobox et les liens entre les versions linguistiques. Ainsi, Wikidata réduit la tâche des wikipédistes tout en augmentant la qualité et la cohérence des contenus » [traduction] (Vrandecic 2013, 90). Avant sa création, il n’existait aucune relation entre les versions linguistiques de Wikipédia, ce qui rendait difficile la navigation entre les versions d’un article sur un artiste, comme passer de la version française à la version allemande de la page du musicien et poète Leonard Cohen. En tant que connecteur, Wikidata joue un rôle d’intermédiaire en s’assurant que tous les articles sur Leonard Cohen soient liés entre eux, quelle que soit la langue. Sur la plateforme, au lieu d’avoir « des articles liés entre eux, Wikidata conserve des listes de tous les articles sur un certain sujet dans les différentes versions linguistiques. Lorsqu’un article est soumis, le logiciel interroge Wikidata pour obtenir cette liste et l’afficher. Les versions linguistiques de Wikipédia sont complètement déchargées de la fonction d’assurer l’entretien de ses listes » [traduction] (Vrandecic 2013, 91). La création de ces connexions a grandement amélioré la fonctionnalité de Wikipédia.

Alors que son rôle initial était la prise en charge des structures techniques de Wikipédia, la base de données Wikidata a rapidement commencé à soutenir d’autres types de projets portant sur les données structurées. D’un côté, Wikipédia est structurée autour de textes écrits souvent sous la forme d’un récit pour être utilisables d’un point de vue humain ; de l’autre, Wikidata est adapté aux traitements automatiques de données. Toutefois, comme Wikipédia, « Wikidata est aussi fondé selon un modèle d’édition communautaire, c’est-à-dire qu’il bénéficie d’une communauté internationale de contributeurs, laquelle inclut autant des spécialistes que des dresseurs de bot. Tout le monde peut ajouter de nouvelles déclarations, des ajouts factuels à l’importation de données à grande échelle » [traduction] (Waagmeester et al. 2020). Cependant, l’édition de données à plus grande échelle de Wikidata, par le téléversement de grands jeux de données, est étroitement liée à leur utilité dans le cadre de projets techniques. Celle-ci est davantage amplifiée par la structure de sa licence. Contrairement à de nombreuses bases de données commerciales propriétaires, « les données de Wikidata sont publiées sous la licence Creative Commons CC-0, laquelle permet à quiconque de réutiliser et de republier les données de quelque manière que ce soit. Les données sont gratuites et sans aucune condition ni exigence » [traduction] (Vrandecic 2013, 90). Ces facteurs rendent l’énorme entrepôt de données intéressant à mobiliser dans le cadre d’autres applications. La taille des données et la licence utilisée sont essentielles à leur succès, notamment dans les secteurs du patrimoine culturel et de l’éducation.

Wikidata et les bibliothèques, les archives et les musées

Les organisations œuvrant dans le patrimoine culturel et la culture, comme les bibliothèques, les archives et les musées, ont été actives dans Wikidata dès le début (Tharani 2021). Lorsque Wikidata a été lancée, de nombreuses organisations culturelles, parfois regroupées sous l’acronyme anglais GLAM (pour Galleries, Librairies, Archives and Museums, soit les galeries d’art, les bibliothèques, les archives et les musées), participaient déjà à d’autres projets Wikimédia, comme Wikipédia et Wikimedia Commons, tirant parti d’initiatives de sensibilisation, comme la campagne Art+Feminism (Proffitt 2018). De même, les organisations culturelles au Canada relevant des GLAM se sont également engagées dans l’utilisation de Wikipédia au cours des activités de sensibilisation, de diffusion et de communication (outreach). Par exemple, l’Art Gallery of Ontario organise des marathons d’éditions (edit-a-thon) depuis 2015 (Wikimedia Commons 2015). Les organisations GLAM développent des liens étroits avec les métadonnées en raison de leurs besoins en gestion de collection et en personnel hautement qualifié dans l’utilisation des métadonnées. Pour cette raison, la barrière à l’entrée pour participer à Wikidata est plus basse qu’auprès d’autres communautés qui ont moins de ressources ou de connaissances techniques. Des facteurs tels que le développement d’un vocabulaire approprié et d’une interface facile à utiliser, ou la possibilité d’intégrer Wikidata dans les catalogues des bibliothèques sont cités parmi quelques-uns des aspects positifs de Wikidata (Allison-Cassin et Scott 2018; ARL 2019).

Wikidata est apparu comme un outil permettant de créer des données liées et d’améliorer l’accès aux organismes GLAM (Allison-Cassin et Scott 2018; Tharani 2021; Ansovini et al. 2022). Toutefois, des interrogations subsistent quant à sa viabilité en tant qu’élément fiable de l’écosystème du secteur en raison de problèmes avec la qualité de ses données, de son manque de cohésion dans son modèle de données et de ses problèmes sous-jacents liés à la disponibilité des données et de l’information au Canada. Les organismes culturels et les secteurs du domaine culturel canadien utilisent Wikidata dans le cadre de leurs efforts pour gérer et rendre accessibles leurs collections. Notamment, la plateforme est une base de connaissances utilisée par des systèmes de traitement automatisé comme Google ou dans le développement d’outils d’IA. Elle permet la recherche contextuelle et la mise en relation d’informations dans la localisation de liens en relation, ce qui contribue à en augmenter la visibilité (Gertner et al. 2023). Bien que la création de ses liens vers des fichiers d’autorité ou vers d’autres sources de données a pour objectif de répondre aux besoins en matière de données et d’information ainsi qu’aux processus sur Wikipédia et dans l’ensemble des projets Wikimédia, Wikidata soutient également des cas d’utilisation externes aux secteurs culturels, notamment sur le contrôle d’autorité (Van Veen 2019; Bianchini, Bargioni, et Pellizzari Di San Girolamo 2021), sur l’influence de la recherche et des profils de chercheurs (Nielsen, Mietchen, et Willighagen 2017; Odell, Lemus-Rojas, et Brys 2022) et sur l’enrichissement des informations sur les collections (Colla et al. 2021; Ansovini et al. 2022; Hawkins 2022).

Wikidata joue un rôle essentiel dans l’interconnexion des contenus axés sur le Canada, améliorant ainsi la visibilité des ressources culturelles tant au Canada qu’à l’international. Par exemple, Wikidata connecte l’élément de l’autrice, poète et actrice Pauline Johnson à l’élément de sa notice dans les catalogues des bibliothèques et dans les ressources d’information, incitant la création d’une carte de connaissances de Google. Tant Wikipédia que Wikidata alimentent les graphes de connaissances de Google, mais les données structurées et lisibles par les machines de Wikidata facilitent ce processus, en plus de permettre également aux wikidatistes d’améliorer plus efficacement les connexions du graphe de connaissances avec d’autres sources d’information. En tant que plateforme de métadonnées qui offre la possibilité de transférer des informations d’une base de données à l’autre, Wikidata a la capacité d’amplifier les collections et les contenus, en plus de solidifier les liens entre les sites de données. Elle augmente l’impact des données, rend des améliorations aux données plus importantes et devient un outil encore plus efficace pour le déplacement des données, renforçant de fait les liens avec notre patrimoine culturel.

Wikidata et les données du festival folk Mariposa

Comme mentionné au début de ce chapitre, j’ai commencé à travailler avec Wikidata dans le cadre d’un projet lié à mon poste de titulaire de la chaire W. P. Scott en bibliothéconomie numérique. Le projet de données liées du festival Mariposa visait à modéliser un réseau de relations entre les artistes du festival sur la base de jeux de données consolidés à partir des programmations. Pour créer ce jeu de données, j’ai commencé par développer un modèle de données idéal fondé sur les catégories d’éléments contenus dans les programmations, puis j’ai poursuivi par l’examen des attributs les plus utiles pour chaque catégorie. Le modèle de données initial incluait plusieurs catégories, comme les artistes, les artisanes, les danseurs, les lieux, les dates et le personnel administratif du festival. Un ensemble d’attributs a été mis sur pied pour chacune de ces catégories de données : pour les artistes, il s’agissait de propriétés comme le nom, le genre musical, le médium avec lequel l’artiste a travaillé et la date à laquelle la performance a eu lieu. L’application Google Sheets a été utilisée pour enregistrer les données dans des feuilles de calcul, et chaque groupe avait sa propre feuille de calcul. Par exemple, une feuille distincte de Google Sheets a été utilisée pour les musiciens et musiciennes. Étant donné qu’il s’agissait d’un projet de données liées et que je désirais établir des liens entre le jeu de données du festival Mariposa et les données ouvertes et en libre accès sur Internet, des sources d’identifiants pérennes (sources of persistent identifiers) ont été incluses. Ces sources comprenaient le fichier d’autorité VIAF (Virtual International Authority File), qui est une source d’informations liée aux données d’autorité des bibliothèques, ainsi que des sources d’identifiants spécifiques au milieu musical, comme MusicBrainz et Discogs. Dans le cadre de son initiative Un avenir numérique lié, l’Association canadienne des organismes artistiques (CAPACOA) s’est intéressée à la création de données structurées pour soutenir la visibilité des artistes, des lieux et des événements des arts de la scène au Canada. Elle a signalé la nécessité d’augmenter la disponibilité des données liées, et par extension des identifiants (Uniform Resource Identifier, URI), pour développer rapidement et efficacement des stratégies numériques au diapason avec les arts de la scène canadiens. En l’absence d’une culture de métadonnées forte, ouverte et stable au Canada, la santé générale des secteurs de la culture et des arts de la scène est affaiblie : « Les métadonnées des arts de la scène sont devenues l’un des enjeux les plus pressants pour les secteurs des arts du spectacle au Canada » (CAPACOA s. d.).

Tout en développant les données relatives au festival Mariposa, j’ai exploré les méthodes disponibles pour transformer les données de la feuille de calcul en données liées et les rendre disponibles sur Internet. Faute de logiciels, d’outils et de ressources accessibles, incluant l’accès à des spécialistes en logiciels de créations de données, je me suis tournée vers Wikidata comme outil et méthode pour créer, puis publier des données relatives au festival. L’excellente compatibilité entre les outils logiciels, comme Google Sheets et OpenRefine et Wikidata, a rendu relativement simple le téléversement des données. De plus, j’ai pu faire tout le travail moi-même, puisque Wikidata est en libre accès, gratuit et soutenu par une communauté active. Utiliser Wikidata pour publier les données était une solution utile qui a aussi permis de souligner plusieurs enjeux d’intérêts sous-jacents à l’utilisation de Wikidata dans le contexte canadien.

Le manque de couverture de la musique canadienne

Le festival Mariposa est l’un des principaux festivals de musique folk au Canada, et le fait d’y participer est un gage de notoriété. Cependant, il s’est avéré difficile de trouver des informations pour compléter les données sur les artistes, les groupes et toute personne qui y a participé. S’il est possible d’utiliser Wikipédia, une encyclopédie ou toute autre source de notoriété pour des artistes comme Gordon Lighfoot et Joni Mitchell, il n’en va pas de même pour la majorité des artistes, d’autant plus que ce festival se distancie des artistes grand public (Mariposa Folk Festival, 2014). Les programmations ne contiennent pas assez de détails biographiques pour remplir convenablement les données requises selon les standards établis par la communauté. Les sources de référence habituelles telles que l’Encyclopédie de la musique au Canada, laquelle a été intégrée à l’Encyclopédie canadienne en 2003, continuent de privilégier la musique classique établie par des musiciens et musiciennes jazz. Malgré qu’elle cherche à étendre sa couverture à la musique populaire, l’Encyclopédie canadienne a encore beaucoup de retard à rattraper pour se défaire des préjugés hérités du comité éditorial de l’Encyclopédie de la musique sur ce qui justifie la notoriété ou l’importance d’artistes ou genres musicaux.

Les journaux locaux et nationaux disposant d’une rubrique ou d’une section régulière de critique musicale peuvent souvent être une bonne source de couverture des artistes. Toutefois, les recherches dans les journaux n’ont pas donné de bons résultats. Par exemple, bien que le groupe torontois The Dirty Shames apparaisse dans les programmations du festival Mariposa et dans les photographies du journal Toronto Telegram (McFadden et al. 1966), ces sources donnent trop peu d’information pour renseigner l’élément Wikidata (2021). Certains détails sur la vie des artistes dans le jeu de données du festival Mariposa ont été trouvés dans des archives de journaux numériques, mais un abonnement payant était nécessaire auprès de tels périodiques, comme le Toronto Star et le Globe and Mail. La nature « verrouillée » de ces ressources signifie qu’elles ne sont plus accessibles au public et que les données ne sont pas en libre accès sur Internet. D’autres détails n’étaient toutefois pas disponibles sous forme numérique et n’ont pu être trouvés. Les journaux ou publications plus modestes peuvent être essentiels pour couvrir des scènes musicales locales, mais les archives de ces publications ne sont pas toujours disponibles, et nombre d’entre elles ne sont plus en activité et leurs sites Internet ne sont plus accessibles. Les médias locaux, tels que les bulletins de nouvelles et les journaux locaux, disparaissent rapidement au Canada ; en 2023, CBC News signalait la fermeture de 70 journaux locaux en Ontario. L’absence de couverture communautaire et la disparition des petits médias locaux ne signifient pas seulement que les populations locales ne sont plus informées sur certains sujets : c’est une perte critique du patrimoine culturel canadien, en plus d’avoir de graves conséquences sur la capacité des wikipédistes de travailler à la documentation de la culture canadienne dans des projets Wikimédia (CBC 2023). Dans le même temps, les journaux communautaires numériques indépendants, comme le West End Phoenix de Toronto, reconfigurent la couverture de l’actualité (s. d.).

Le manque d’information sur la musique canadienne sous format numérique est un défi non seulement pour mener des recherches sur des éléments individuels, mais aussi pour s’assurer de la fiabilité des données. Dans les premières années de Wikidata, référencer les déclarations était une bonne pratique pour développer la connaissance sur la plateforme, bien qu’elle demeurât optionnelle. Par conséquent, il aurait dû être essentiel d’inclure des références lors de l’ajout de données à Wikidata dans le cadre du projet du festival folk Mariposa. Depuis la création de ce projet, les références sont devenues essentielles pour établir la notoriété. Les métadonnées de provenance sont cruciales pour la plateforme Wikidata. Elles ont la même fonction que les citations : « Les références sont utilisées pour indiquer quelles sources spécifiques peuvent soutenir l’information ajoutée dans une déclaration » [traduction] (2023b). Une déclaration qui suggère que le lieu de naissance de Céline Dion est Charlemagne doit être étayée par des références de sources fiables dans lesquelles l’information peut être vérifiée. Comme dans le cas de Wikipédia, les sources secondaires et tertiaires fiables et de haute qualité sont à prioriser. L’ajout de références aux déclarations Wikidata augmente la qualité des données liées pour de nombreuses utilisations, en plus de fournir des données de meilleure qualité pour des applications avec une IA. Un manque de références peut avoir des incidences sur l’utilité même des données (Beghaeiraveri, Gray, et McNeill 2024).

Le manque de références facilement accessibles pour les déclarations sur les artistes du festival folk Mariposa a un effet aggravant et met en évidence un problème le plus important de la disponibilité des informations sur la musique et les arts. Dans les projets ultérieurs que j’ai déployés à l’aide de Wikidata, sur la documentation de la littérature, le patrimoine bâti ou les films par exemple, l’incapacité à fournir des références et une provenance pour les données canadiennes sur Wikidata pose de sérieux problèmes. Comme cela a été noté pour Wikipédia, les sources établies et fiables doivent avoir prouvé leur notoriété, et le manque de documentation est connu (McCracken 2018). Il peut donc être difficile de rédiger des articles et de veiller à ce qu’ils ne soient pas supprimés. Le lien entre la notoriété et le besoin de références pour les déclarations rend difficile la création de données sur des éléments canadiens, puisqu’ils risquent d’être supprimés. De manière générale, le manque de documentation sur les activités musicales au Canada rend difficile la constitution de jeux de données exhaustifs et bien référencés sur la musique dans Wikidata.

Wikidata et la campagne Music and Belonging : Canada at 150

En réponse au peu d’informations sur la musique canadienne, autant sur Wikipédia que sur Wikidata, j’ai lancé la campagne Wikimédia « Music and Belonging : Canada at 150 » (Musique et appartenance : le Canada à 150 ans). Celle-ci avait pour but de produire plus de contenus et de sensibiliser une plus large communauté au manque d’information sur la musique canadienne. Elle a été développée pour concentrer les efforts pancanadiens sur la création de contenus sur la musique au Canada (Allison-Cassin et Scott 2018). En tant que membre de l’Association canadienne des bibliothèques, archives et centres de documentations musicaux (ACBM), je trouvais logique de faire appel à la communauté des bibliothèques musicales au Canada, laquelle dispose d’un réseau de personnes intéressées et bien informées, tant sur la musique que sur l’information. À l’origine, cette initiative a été conçue pour s’intégrer aux activités du 150e anniversaire de la Confédération canadienne et a repris le thème de la conférence annuelle de la Société canadienne pour les traditions musicales, de l’Association canadienne des bibliothèques, archives et centres de documentation musicaux, et de la branche canadienne de l’Association internationale pour l’étude de la musique populaire. Elle a aussi été financée par Wikimédia et par le fonds pour les événements spéciaux de l’Université York. Cette campagne incluait un atelier en personne à l’Université de Toronto, deux ateliers virtuels, et plusieurs événements disséminés sur une année. Les événements ont eu lieu à l’Université de l’Île-du-Prince-Édouard à Charlottetown, à l’Université Memorial de Terre-Neuve, à l’Université Western Ontario à London, à la Hamilton Public Library à Hamilton, à l’Université York et à l’Université de Toronto à Toronto, à l’Université Laurentienne à Sudbury, à l’Université du Manitoba à Winnipeg, à l’Université de la Saskatchewan à Saskatoon et à l’Université MacEwan à Edmonton. Les événements ont été organisés par Dan Scott (Université Laurentienne), Caroline Doi (Université de Saskatchewan) et Monica Fazekas (Université Western). Un même logo a été utilisé tout au long de la campagne. Pour documenter tout ce travail, un tableau de bord des événements Wikimédia a été utilisé. Il couvre 11 programmes et le travail de 124 wikipédistes, en plus de documenter la création de 24 nouveaux articles et la modification de 187 articles.

Le coup d’envoi de la campagne a été donné lors d’un atelier d’une journée à l’Université de Toronto. Comme celui-ci coïncidait avec la réunion annuelle de plusieurs associations professionnelles liées à la musique, des bibliothécaires et des chercheurs en musique ont participé à l’atelier. Ce dernier a été conçu pour « former les formateurs » en donnant des instructions sur le processus d’édition de Wikipédia et de Wikidata, en plus d’ouvrir des discussions sur la manière de préparer des marathons d’édition. L’objectif du projet était de venir en aide aux personnes qui allaient organiser de telles journées durant la campagne. L’événement comprenait une session de discussion avec des personnalités locales, comme Amy Furness, archiviste aux collections spéciales Rosamon Ivey et cheffe de la bibliothèque et des archives du Musée des beaux-arts de l’Ontario, et John Dupuis, bibliothécaire scientifique à l’Université York avec une expérience dans l’organisation de marathons d’édition lors de campagnes, comme Art+Feminism et Ada Lovelace Day. L’atelier s’est révélé être un mécanisme essentiel pour que les personnes participantes puissent acquérir de l’expérience et des compétences, en plus d’engager des discussions sur les sujets susmentionnés sur la disponibilité des sources d’information concernant la musique canadienne. Parmi les sujets de conversation animée, il y avait la question de savoir « pourquoi Wikipédia » plutôt qu’un autre site Internet institutionnel ou une autre forme de publication. Cela a donné lieu à des débats sur le libre accès et l’utilisation des licences libres.

Ces événements se sont déroulés de 2016 à 2017, et Wikidata était encore relativement inconnu auprès des bibliothèques, archives et musées canadiens. Peu de contenus étaient donc disponibles lors des ateliers. Dan Scott, bibliothécaire à l’Université Laurentienne, a joué un rôle déterminant dans la création et l’animation des ateliers sur Wikidata et la création de matériel didactique (Scott 2017a). Grâce à ce travail et au projet du festival folk Mariposa, Scott et moi avons travaillé à la modélisation d’un moyen de capturer les données des festivals de musique à l’aide de Wikidata. Plus précisément, Scott s’est concentré sur le Northern Light Festival Boréal qui met l’accent sur des considérations bilingues (Scott 2017b). Le travail collaboratif sur Wikidata, à partir du projet Music in Canada @ 150, a tôt offert un engagement dans la création de données liées à la musique et est devenue la base pour les futurs efforts de collaboration entre Scott et moi, y compris un atelier lors de la conférence à l’Association des bibliothèques de l’Ontario sur l’ajout de bibliothèques aux projets Wikimédia et un autre lors de la conférence Semantic We in Librairies sur Wikibase. La campagne a également donné lieu à la création de la conférence GLAM-Wiki à Toronto en 2019 qui a attiré plus de 100 personnes participantes des bibliothèques, archives et musées de la région de Toronto.

La campagne Music in Canada @ 150 est née en réponse aux lacunes que j’ai observées en travaillant sur le projet de données du festival folk Mariposa. Dans une large mesure, la campagne a réussi à mobiliser les bibliothécaires des bibliothèques musicales intéressées par les épineuses questions liées à l’information sur la musique. Même si elles existaient avec le projet, les communautés de bibliothèques musicales impliquées dans le projet ont prouvé qu’il est possible de participer au développement de Wikidata, puisque leurs membres désirent trouver des mécanismes pour soutenir la visibilité de la musique au Canada. Scott a résumé succinctement les efforts déployés :

Notre argument central était que, plutôt que de se concentrer sur l’amélioration directe de nos propres silos de dépôts de données locaux (par exemple les catalogues de bibliothèques, les expositions numériques), les bibliothèques et les archives devraient plutôt investir leurs ressources limitées dans l’enrichissement de Wikidata, un dépôt de données centralisé, pour maximiser la visibilité de ces entités et la réutilisation des données dans le monde entier […] et ensuite extraire ces mêmes données pour nos dépôts locaux afin d’enrichir nos affichages et notre intégration au monde plus large des données [traduction] (Scott 2017b).

Toutefois, il est difficile d’évaluer les impacts à long terme de ces campagnes sur l’utilisation de Wikipédia et de Wikidata pour le contenu musical, et nous n’avons pas effectué de suivi auprès des personnes participantes. Évidemment, organiser des campagnes d’édition ne permettra pas de résoudre le problème du manque de sources secondaires et tertiaires sur la musique canadienne.

Comme avec Wikipédia, Wikidata est un projet organisé par des bénévoles, et les propriétés utilisées et disponibles sont choisies par l’obtention d’un consensus auprès des membres de la communauté. S’il peut être très avantageux d’offrir une plus grande flexibilité dans la création de données, cela aura pour conséquence d’avoir des données moins standardisées que celles utilisées par les systèmes qui utilisent des ontologies telles que le CIDOC CRMNote du traducteur : Le CIDOC CRM est un modèle sémantique de référence du Conseil international des musées (ICOM, en anglais International Council of Museum). Plus spécifiquement, le CIDOC CRM a été développé par le Comité international pour la documentation (CIDOC, en anglais International Commitee for Documentation). Le modèle conceptuel de référence (CRM, en anglais Conceptual Reference Model) est un modèle sémantique développé par le CIDOC.↩︎ ou par les systèmes descriptifs normalisés des bibliothèques. Wikidata n’a pas de structure hiérarchique stricte ; par exemple, les concepts plus larges ou plus étroits ne sont pas nécessairement respectés. Un autre problème connu est relié à la nature multilingue de Wikidata. La traduction ne permet jamais une transposition univoque et les concepts sont complexes à saisir. Augmenter la disponibilité des informations en ligne sur des sujets canadiens n’est pas un problème qui doit être réglé uniquement par les membres de la communauté Wikidata. La tâche d’envisager des projets de numérisation et d’archivages sur Internet revient plutôt aux gouvernements, aux bibliothèques, aux archives et aux organisations musicales.

Wikidata et les événements

Le projet de données du festival folk Mariposa a permis d’explorer des aspects de la description des données culturelles qui seraient autrement impossibles avec les pratiques descriptives traditionnelles des bibliothèques et des archives. Une dimension importante de ce travail était la création d’éléments Wikidata sur des événements ou des objets qui durent dans le temps, généralement le matériel des bibliothèques ou des archives qui est inclus dans des collections d’objets, comme des livres, des manuscrits ou des enregistrements. Le besoin ou l’intérêt pour une collection axée sur des objets crée des limites dans la façon qu’il est possible de le décrire, restreint son accès et nuit à la compréhension des œuvres d’art qui s’inscrivent dans le temps comme la musique. Wikidata rend possible la description d’événements et fournit d’excellentes cotes (dimension) en lien avec les données. La capacité de décrire des événements a été un des atouts de Wikidata pour le projet du festival Mariposa.

Wikidata permet la représentation des éléments dans le temps. La création d’outils de génération de frises chronologiques est devenue une méthode populaire de visualisation des données, et un certain nombre d’outils ont été développés pour tirer parti des éléments de Wikidata qui contiennent des données liées aux dates. Toutefois, la modélisation des événements du festival Mariposa a été traitée de manière plus détaillée en associant les personnes participantes aux événements. Les projets Wikidata constituent un moyen efficace pour apprendre la meilleure façon de modéliser et de créer des données en relation avec des sujets spécifiques et ils peuvent souvent fournir le support nécessaire pour comprendre un sujet. Les projets Wikidata, comme celui intitulé WikiProjet Lieux culturels, sont utiles pour passer en revue les enjeux essentiels liés à la description d’événements culturels. Pour le projet de données du festival Mariposa, il est devenu clair que la création manuelle de données sur les événements était un effort laborieux : chaque artiste-interprète devait avoir sa propre entrée Wikidata, ce qui représentait beaucoup de temps et d’effort. Ainsi, bien que la création de données granulaires soit une représentation plus complète du festival lui-même, elle est devenue laborieuse. Et même si plusieurs années se sont écoulées depuis la création du projet de données du festival Mariposa, la question du rapport entre l’investissement en main-d’œuvre et les impacts positifs perçus demeure pertinente, compte tenu des défis contemporains dans la création de données structurées. La disponibilité croissante d’outils axés sur le traitement du langage naturel peut réduire le besoin de saisir manuellement des données, mais une dépendance subsiste quant à la création de données lisibles par machine.

Représentation des collections d’archives au Canada

La création de données relatives aux collections et aux fonds d’archives sur Wikidata peut contribuer à donner une vision d’ensemble plus claire des collections des institutions canadiennes et peut rendre les sources primaires plus faciles à trouver. Le projet de données du festival folk Mariposa s’est concentré sur une collection d’archives conservées aux Clara Thomas Archives and Special Collections de l’Université York. L’une des façons de relier les collections uniques détenues par les institutions canadiennes et Wikidata est d’utiliser la propriété « Archivé par ». Une propriété sur Wikidata, peut-on lire sur la page d’aide dédiée à cette notion, « décrit la valeur des données d’une déclaration et peut être considérée comme une catégorie de données, par exemple “couleur” pour la valeur “bleu”. Les propriétés, lorsqu’elles sont associées à des valeurs, forment une déclaration dans Wikidata ». En grande partie, les propriétés définissent la structure de Wikidata et doivent être adoptées par un consensus de la communauté. Wikidata est constitué de déclarations qui incluent une propriété et une valeur, sous la forme d’un élément. Les valeurs dans Wikidata peuvent être des liens internes à d’autres éléments de Wikidata ou être des liens externes associés à des adresses Internet permanentes, nommément un URI. En juin 2024, Wikidata répertoriait 140 propriétés liées aux archives, aux personnes et aux organisations (Liu 2018). La plupart des propriétés répertoriées sont des identifiants externes, mais un petit nombre d’entre elles sont utilisées pour décrire des collections. Par exemple, la propriété P485, « Archivé par » relie l’élément Wikidata décrit aux institutions qui détiennent les archives pour cet élément. Katrina Cohen-Palacios (2019), archiviste à l’Université York, a présenté et fourni des documents d’atelier sur l’ajout de fonds d’archives à Wikidata, comme la méthode pour ajouter un lien à l’élément Wikidata « Toronto Telegram Newspapers » vers l’élément « Clara Thomas Archives and Special Collections ». Cohen-Palacios (2019) a suggéré que la création d’informations sur les instruments de recherche dans Wikidata peut faire gagner du temps aux archivistes en automatisant certaines tâches qui pourraient autrement devoir être maintenues manuellement.

Suivant les exemples présentés par Cohen-Palacios (2019), Ansovini et ses coauteurs (2022) ont lancé une initiative visant à ajouter à Wikidata certaines informations provenant des fonds d’archives de l’Université de Toronto. L’ajout d’informations sur les archives peut aider les individus (et les machines) du monde entier à trouver et à améliorer les collections et documents liés à la culture canadienne. En outre, l’ajout d’informations provenant des fonds d’archives relie les institutions au réseau Wikidata, ce qui permet d’effectuer des requêtes et des visualisations de données pour obtenir des vues différentes sur une myriade de connexions. À partir de leur travail sur l’autrice canadienne Margaret Atwood, Ansovini et ses coauteurs (2022) ont constaté que « le simple ajout d’un triplet “Archivé par”, qui lie les documents à un article Wikidata, permet les types de connexions qui peuvent avoir été faites dans la salle de lecture, où les archivistes utilisent leurs connaissances contextuelles pour suggérer aux chercheurs des ressources liées aux personnes, aux dates importantes ou aux publications notables. Wikidata peut fournir des points d’accès générés par la communauté et exploitables par des machines qui rendent les recherches exploratoires possibles pour visualiser, rechercher et explorer les relations entre entités » [traduction]. Le projet de données du festival folk Mariposa a permis quelques expérimentations en ajoutant à Wikidata des informations sur les fonds d’archives ; les Clara Thomas Archives and Special Collections ont également été mobilisées pour ajouter du contenu en lien avec le festival Mariposa. Le réseau ci-dessous, généré avec une requête SPARQL, exprime les relations qu’entretient ce fonds d’archives dans Wikidata (voir la figure 4.1). Le festival folk Mariposa est maintenant lié par un graphe aux Clara Thomas Archives and Special Collections de l’Université York.

Figure 4.1 - Représentation sous forme de réseau des propriétés Wikidata liées à la collection d’archives conservées aux Clara Thomas Archives and Special Collections de l’Université York

En tant qu’activité, l’ajout d’une déclaration à des éléments Wikidata existants en lien avec des fonds d’archives est plus facile à réaliser que la création d’entrées pour des festivals, car elle est limitée dans son champ d’application et ne nécessite pas de connaissances techniques approfondies. Alors que l’ajout de fonds d’archives pourrait avoir un impact dans la création des données structurées en lien avec les archives plus larges d’Internet, les fonds d’archives disponibles sur Wikidata sont irréguliers. Cohen-Palacios (2019) a mis en évidence cette disparité à l’aide d’une visualisation montrant que certaines institutions, principalement en Ontario et au Québec, ont entre 300 et 550 fonds répertoriés, tandis que d’autres sont moins représentées. La création d’entrées pour les fonds d’archives pourrait bénéficier d’une sensibilisation et d’un soutien afin d’assurer une plus grande équité dans la couverture, sans quoi l’impact de ces listes risque de rester relativement faible. D’autres sites de patrimoine culturel utilisent aussi Wikidata comme outil de travail. Par exemple, le Réseau canadien d’information sur le patrimoine (RCIP) utilise Wikidata pour leur projet Nomenclature. Le projet vise à créer un vocabulaire de données liées à utiliser dans le secteur des musées et le RCIP s’est concentré, à ce stade du projet, sur la description des œuvres d’art. Tandis que RCIP s’aligne sur le CIDOC CRM en tant que norme de contenu et de schématisation, il envisage Wikidata comme un moyen de relier les collections entre elles et de les rendre davantage visibles.

Wikidata et les données autochtones au Canada

Créée en 1968, la zone pour les peuples autochtones (Native People’s Areas) était une autre facette du projet de données du festival folk Mariposa. Un espace physique dans l’enceinte du festival était dédié à celle-ci. Des musiciennes, des danseurs et des conteuses faisaient partie de la programmation. La cinéaste et artiste abénaquise Alanis Obomsawin a assuré le commissariat de la zone des peuples autochtones de 1970 à 1976, et la programmation témoigne de l’influence de la montée des mouvements de défense des droits des Autochtones au Canada et aux États-Unis. Par exemple, des groupes comme North American Indian Travelling College et des artistes comme le poète Duke Redbird ont participé au festival. Dans le cadre de la production de données en lien avec le festival folk Mariposa, à la zone des peuples autochtones correspondait son propre jeu de données. À l’instar des autres dimensions du projet, travailler avec les données du festival Mariposa sur Wikidata a mis en évidence des enjeux pertinents à la discussion plus large sur l’utilisation de Wikidata dans le contexte canadien.

Comme souligné plus tôt dans ce chapitre, il a été difficile de trouver des informations sur les individus inscrits dans les programmations, une situation qui s’est révélée encore plus difficile pour les artistes de la zone des peuples autochtones. Si certaines personnes connues apparaissaient dans la programmation, comme Shingoose, ce n’était pas le cas pour beaucoup d’autres dont les noms apparaissaient seulement sous la forme d’un nom général, comme « Six Nations Reserve Dancers » ou « Metis Group ». Les recherches dans les archives du festival Mariposa n’ont pas permis d’obtenir plus d’information : en l’absence d’informations plus spécifiques, il était impossible d’ajouter ces personnes à Wikidata. Le manque d’information en lien avec la zone des peuples autochtones pourrait être un exemple de manque d’attention ou de connaissances de la part des personnes organisatrices du festival. De plus, ce même manque d’information sur ces groupes sous-entend généralement un manque d’information au sein du vaste paysage canadien. Bien qu’il puisse sembler approprié d’ajouter le nom des personnes participantes dans une base de données interne malgré leurs noms vagues ou incertains, de telles informations sont toutefois inappropriées pour une base de connaissances globale et ouverte, car leur signification est imprécise. Il est important de soigneusement réfléchir aux usages de Wikidata par rapport à un dépôt ou une base de connaissances contrôlée et hébergée en interne.

En outre, la pertinence d’utiliser Wikidata au Canada pour examiner les données autochtones est un sujet de préoccupation crucial. Les données autochtones peuvent être définies comme « des données, de l’information, des connaissances, sous quelque forme que ce soit, qui ont un impact sur les peuples, nations et communautés autochtones aux niveaux collectif et individuel; des données sur leurs ressources et leurs environnements, sur eux en tant qu’individus et en tant que collectivités » [traduction] (Carroll et al., 2021). Cette définition de grande envergure est conforme à la compréhension de l’expression autochtone telle qu’utilisée en droit, notamment dans la Déclaration des Nations Unies sur les droits des peuples autochtones (DNUDPA). Compte tenu de cette compréhension, une grande partie des données sur Wikidata relatives aux territoires, environnements et peuples autochtones dans le pays, aujourd’hui connu sous le nom de Canada, sont des données autochtones. Le 21 juin 2021, le gouvernement fédéral canadien a adopté le projet de loi C-15, la Loi sur la Déclaration des Nations Unies sur les droits des peuples autochtones. Sa mise en application « prévoit pour le gouvernement du Canada de prendre les mesures nécessaires pour veiller à ce que les lois fédérales soient compatibles avec la Déclaration des Nations Unies sur les droits des peuples autochtones et d’élaborer et de mettre en œuvre un plan d’action visant à atteindre les objectifs de la Déclaration » (Parlement du Canada 2020). Bien que la DNUDPA et le projet de loi C-15 aient été critiqués par certaines communautés autochtones, ils fournissent néanmoins un cadre et des moyens de mettre en œuvre les mesures nécessaires pour passer à l’action dans la reconnaissance des droits autochtones, dont les connaissances, les cultures, les données et les informations. La DNUDPA et le projet de loi C-15 donnent l’élan nécessaire aux gouvernements municipaux et provinciaux, de même qu’aux organisations, pour envisager des mesures pour harmoniser les politiques et pratiques.

Le mouvement mondial grandissant visant la souveraineté des Autochtones appelle à la nécessité d’une reconnaissance, d’une gouvernance et de systèmes qui garantissent aux peuples autochtones le contrôle de leurs données, y compris les données liées aux territoires et aux cultures. En tant que projet ouvert et en libre accès, Wikidata adhère aux principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable) qui engendrent des impacts positifs sur la communauté des savoirs libres (Odell, Lemus-Rojas, et Brys 2022). Toutefois, les principes FAIR ignorent « les différences de pouvoir et les contextes historiques » [traduction] et soutiennent potentiellement des pratiques extractives qui continuent de nuire aux peuples autochtones (Hudson 2020). Le caractère absolu et non spécifique du libre accès est largement reconnu comme problématique (Anderson et Christen, 2019). Au moment de la rédaction de ce chapitre, Wikidata n’avait aucun mécanisme pour garantir que les données autochtones soient traitées de manière appropriée, y compris assurer la mise en place de mécanismes pour éviter que des données soient ajoutées de manière non éthique. Idéalement, la communauté de Wikidata et la Fondation Wikimédia travailleraient à la mise en œuvre des principes CARE pour les données autochtones : Collectivement bénéfique, Autorité de contrôle, Responsabilité et Éthique (Hudson 2020). La Global Indigenous Data Alliance (GIDA) appelle les organisations à respecter le principe du #BeFAIRandCARE (être juste et attentionné). Compte tenu de l’absence de mécanismes pour traiter et gérer de manière éthique les données autochtones, il est difficile d’envisager comment Wikidata pourrait être librement employée pour utiliser ces données.

Le modèle de données pose également un problème pour les données autochtones et la représentation respectueuse des peuples, territoires et cultures autochtones sur Wikidata. Un exemple typique est le manque de ressources pour identifier adéquatement les peuples autochtones dans la plateforme. En effet, ceux-ci peuvent s’identifier de diverses façons et leur identité peut être liée autant à leur communauté qu’à leur nation. Wikidata n’a pas les moyens requis pour présenter les nations autochtones en tant que nations. Les nations autochtones ont plutôt été catégorisées selon leur appartenance ethnique. L’identité autochtone n’est pas une ethnie, et les travaux récents de Allison-Cassin (2023) et de Johnston, Julien et Singh (2022) suggèrent que les problèmes structurels du modèle de données de Wikidata pour documenter les identités autochtones constituent de sérieux obstacles pour considérer Wikidata comme une plateforme appropriée pour traiter de l’information sur les peuples autochtones. Un autre problème lié à l’identification d’une communauté est le manque de liens entre les nations autochtones et les items Wikidata. Dans Elements of Indigenous Style, Greg Younging souligne à plusieurs occasions l’importance de reconnaître l’identité nationale autochtone pour parler des peuples autochtones. Il avance que la nation « est devenue généralement acceptée par les peuples autochtones pour décrire différents groupes autochtones distincts en tant qu’entités politiques » [traduction] (2018). De plus, Younging affirme que certains peuples autochtones s’identifient à une nation officielle, comme la Nation métisse d’Alberta. Cependant, Wikidata ne permet pas de lier les peuples autochtones à des nations, ce qui rend l’utilisation de Wikidata inappropriée ou discutable, spécifiquement en regard des interprétations issues de la DNUDPA et des diverses initiatives et pratiques liées à l’autodétermination.

Qui plus est, Wikipédia entraîne et amplifie certains problèmes structurels de Wikidata quant aux données autochtones. Bien que ces problèmes puissent être involontaires, ils représentent néanmoins des obstacles supplémentaires au traitement adéquat des données autochtones, engendrant ainsi un problème spécifique au contexte de Wikidata Canada. Un exemple marquant est la façon dont les zones géographiques sont structurées dans Wikidata, ce qui devient d’autant plus frappant pour les territoires autochtones. En raison de la Loi sur les Indiens, de nombreux membres des Premières Nations ont été expulsés de leurs territoires traditionnels, qui ont été remplacés par un système de réserves. Généralement, ces réserves sont des zones géographiques occupées par les membres d’une seule Première Nation, et chaque réserve possède également son propre système de gouvernance, le conseil de bande, imposé par le gouvernement fédéral du Canada. Dans Wikidata, une confusion existe entre les « types » d’entités pour décrire les communautés des Premières Nations. Par exemple, pour décrire une Première Nation, la propriété « Nature de l’élément » pourrait être une bande de Premières Nations, un lieu géographique, voire une autre entité. Cette confusion dans la structure de données est souvent due à la création automatique d’éléments dans Wikidata à partir des articles de Wikipédia, où, sous forme narrative, il y a peu de confusion. Brown affirme que « [l]es logiques de description sont hostiles à l’ambiguïté » [traduction] (Brown 2022, 3). L’ambiguïté qui subsiste autour de ce que l’on entend par « Première Nation » est un problème structurel qui engendre de graves problèmes dans la gestion des données. Pour une discussion approfondie sur ce sujet, voir Allison-Cassin (2023).

En ce qui concerne les données du festival folk Mariposa, il s’est avéré difficile de documenter l’identité des individus et de tenir compte des considérations discutées ci-dessus. Dans le rapport de la CAPACOA, Indigenous Artists and Wikidata : Explorations and Consultations (s. d.), les préoccupations générales exprimées par les personnes participantes quant à la pertinence de Wikidata pour leurs données de profils sont graves, malgré la taille restreinte du groupe de consultation. Malgré son apparente ouverture sans parti pris, Wikidata a été conçu et structuré en fonction des conceptions occidentales du monde. Son modèle peut être changé et modifié par consensus communautaire, mais il n’en demeure pas moins que les membres de cette communauté n’incluent probablement que très peu de personnes autochtones. La portée de certains des problèmes est d’une telle ampleur que des interventions majeures pourraient être nécessaires. De plus, peu de personnes sont sensibilisées à connaître et comprendre les différents systèmes de connaissances, et il en va de même quant à l’importance de bien saisir les enjeux liés aux régimes de propriété intellectuelle.

Conclusion

Le projet de données liées du festival folk Mariposa a permis d’expérimenter la création d’un réseau de données liées à partir de Wikidata. D’un point de vue canadien, les défis rencontrés en travaillant avec Wikidata soulignent des enjeux qui dépassent l’utilisation de la base de données pour des données culturelles canadiennes. Par exemple, d’importants enjeux persistent sur Wikidata quant à la place qu’offre la plateforme aux données autochtones, ce qui exige une intervention opportune et essentielle. De plus, la fermeture de journaux communautaires et de médias locaux se poursuit et nuit aux efforts de documentation des sujets canadiens des personnes qui travaillent sur les plateformes de Wikimédia. Au fur et à mesure que la plateforme Wikidata se développe et devient une plaque tournante pour les données structurées, les personnes au Canada devront élaborer des moyens pour offrir et promouvoir de nouvelles façons d’ajouter des données sur la plateforme, plus spécifiquement en ce qui concerne les communautés qui ne sont pas bien représentées dans les données traditionnelles. Peut-être que Wikidata ne jouera jamais un rôle clair dans la vie quotidienne des gens ; néanmoins, la plateforme joue un rôle important dans la transition vers des données ouvertes au Canada, comme en témoignent ses nombreuses et différentes utilisations au Canada. Pour que les institutions et les individus puissent y participer plus efficacement, une grande attention doit être portée aux métadonnées et aux pratiques numériques des organisations afin d’améliorer la disponibilité des identifiants stables, des données ouvertes et des sources de référencement pour les éléments Wikidata. En reconnaissant la nécessité de soutenir les initiatives de données ouvertes qui serviront toutes les personnes au Canada, plusieurs agences culturelles du gouvernement fédéral canadien utilisent déjà Wikidata : « Ceci permet de réduire le travail entourant plusieurs facettes de la gestion numérique des collections en mobilisant l’expertise et les mises à jour faites par d’autres équipes dont l’autorité est établie » (Gouvernement du Canada 2023). Il convient aussi de rappeler que, « en tant que la plus grande base d’informations jamais rassemblées, Wikipédia reste à la fois une réalisation humaine stupéfiante et un puits sans fond d’améliorations, tant au niveau du contenu que de la communauté » [traduction] (McDowell et Vetter 2021, 91). Wikidata continuera sans doute à se développer au Canada en développant et en soutenant la communauté. Comme la chercheuse canadienne en humanités numériques Susan Brown le suggère, « bâtir sa communauté et développer des collaborations intersectorielles sont probablement les points les plus importants pour aborder efficacement les enjeux liés à la diversité, compte tenu des ressources substantielles et des infrastructures requises pour travailler avec les données ouvertes et liées » [traduction] (2022). Un avenir fort et diversifié pour Wikidata au Canada renforcera la présence numérique du pays.

Références

Accéder à cette bibliographie sur Zotero

Allison-Cassin, Stacy. 2012. « The Possibility of the Infinite Library: Exploring the Conceptual Boundaries of Works and Texts of Bibliographic Description ». Journal of Library Metadata 12 (2-3): 294‑309. https://doi.org/10.1080/19386389.2012.700606.
———. 2015. « Sounding It Out: The Mariposa Folk Festival and a Linked Open Data Digital Library ». Sydney, Australie.
———. 2023. « Indigenous Nationhood, Sovereignty and Linked Data: A Wikidata Case Study Examination of the Métis Nation ». In Ethics in Linked Data, édité par A. Provo, K. Burlingame, et B. M. Watson. Litwin Press. http://hdl.handle.net/10222/84374.
Allison-Cassin, Stacy, et Dan Scott. 2018. « Wikidata: A Platform for Your Library’s Linked Open Data ». The Code4Lib Journal, nᵒ 40. https://journal.code4lib.org/articles/13424.
Ansovini, Daniela, Kelli Babcock, Tanis Franco, Jiyun Alex Jung, Karen Suurtamm, et Alexandra Wong. 2022. « Knowledge Lost, Knowledge Gained: The Implications of Migrating to Online Archival Descriptive Systems ». KULA: Knowledge Creation, Dissemination, and Preservation Studies 6 (3): 1‑19. https://doi.org/10.18357/kula.234.
ARL. 2019. « ARL White Paper on Wikidata: Opportunities and Recommendations ». Report. Association of Research Libraries. https://apo.org.au/node/254221.
Beghaeiraveri, S. A. H, A. J. G. Gray, et F. McNeill. 2024. « RQSS: Referencing Quality Scoring System for Wikidata Www.Semantic-Web-Journal.Net ». Semantic Web – Interoperability, Usability, Applicability. https://www.semantic-web-journal.net/content/rqss-referencing-quality-scoring-system-wikidata-1.
Bianchini, Carlo, Stefano Bargioni, et Camillo Carlo Pellizzari Di San Girolamo. 2021. « Beyond VIAF: Wikidata as a Complementary Tool for Authority Control in Libraries ». Information Technology and Libraries 40 (2). https://doi.org/10.6017/ital.v40i2.12959.
Brown, Susan. 2022. « Same Difference: Identity and Diversity in Linked Open Cultural Data ». International Journal of Humanities and Arts Computing 16 (1): 1‑16. https://doi.org/10.3366/ijhac.2022.0273.
CAPACOA. s. d. « Un avenir numérique lié ». Consulté le 28 février 2025. https://linkeddigitalfuture.ca/fr/accueil/.
CBC. 2023. « Community Newspapers Face &Apos;Existential Crisis' Amid Declining Revenues, Meta's News Ban, Some Say ». CBC News, décembre. https://www.cbc.ca/news/canada/toronto/community-newspapers-toronto-1.7040996.
Cohen-Palacios, Katrina. 2019. « Wikidata and Archivists », octobre. http://hdl.handle.net/10315/36898.
Colla, Davide, Annamaria Goy, Marco Leontino, et Diego Magro. 2021. « Wikidata Support in the Creation of Rich Semantic Metadata for Historical Archives ». Applied Sciences 11 (10): 4378. https://doi.org/10.3390/app11104378.
Gertner, Jon, Adrienne Hurst, Marion Lozano, John Woo, Daniel Ramirez, et Anj Vancura. 2023. « The Sunday Read: Wikipedia’s Moment of Truth ». The New York Times, septembre. https://www.nytimes.com/2023/09/10/podcasts/the-daily/wikipedia-ai.html.
Gouvernement du Canada. 2023. « Survol des données ouvertes et liées ». Gouvernement du Canada. https://www.canada.ca/fr/services/culture/histoire-patrimoine/museologie-conservation/gestion-collections/donnees-ouvertes-liees/survol-donnees-overtes-liees.html.
Hawkins, Ashleigh. 2022. « Archives, Linked Data and the Digital Humanities: Increasing Access to Digitised and Born-Digital Archives via the Semantic Web ». Archival Science 22 (3): 319‑44. https://doi.org/10.1007/s10502-021-09381-0.
Hudson, M. 2020. « Indigenous Data Sovereignty: Towards an Equitable and Inclusive Digital FutureA Digital New Deal ». https://projects.itforchange.net/digital-new-deal/2020/11/01/indigenous-data-sovereignty-towards-an-equitable-and-inclusive-digital-future/.
Johnston, Brit, Frédéric Julien, et Anju Singh. 2022. « Les artistes autochtones et Wikidata : rapport d’exploration et de consultation ». Un avenir numérique lié. https://linkeddigitalfuture.ca/fr/recherche/artistes-autochtones-et-wikidata/.
Liu, S. 2018. « Wikidata Property Explorer ». https://prop-explorer.toolforge.org/.
McCracken, Krista. 2018. « Doing the Work: Editing Wikipedia as an Act of Reconciliation ». On Archivy. https://medium.com/on-archivy/doing-the-work-editing-wikipedia-d82e927adb9f.
McDowell, Zachary J., et Matthew A. Vetter. 2021. Wikipedia and the Representation of Reality. Routledge.
McFadden, Frank, McFadden, John Raymond, et Toronto Telegram. 1966. « The Dirty Shames, in Performance at The Riverboat [Carol Robinson and Roy Michaels Sharing One Microphone in Foreground, Chick Roberts and Amos Garrett Sharing Another Microphone in Background]. » Toronto Telegram. https://digital.library.yorku.ca/node/1078262.
Nielsen, Finn Årup, Daniel Mietchen, et Egon Willighagen. 2017. « Scholia, Scientometrics and Wikidata ». In The Semantic Web: ESWC 2017 Satellite Events, édité par Eva Blomqvist, Katja Hose, Heiko Paulheim, Agnieszka Ławrynowicz, Fabio Ciravegna, et Olaf Hartig, 237‑59. Cham: Springer International Publishing. https://doi.org/10.1007/978-3-319-70407-4_36.
Odell, Jere, Mairelys Lemus-Rojas, et Lucille Brys. 2022. « Selected Tools for Using Wikidata ». In. IUPUI University Library. https://doi.org/10.7912/5MTV-H307.
Parlement du Canada. 2020. « Loi Concernant La Déclaration Des Nations Unies Sur Les Droits Des Peuples Autochtones ». https://www.parl.ca/legisinfo/fr/projet-de-loi/43-2/c-15.
Proffitt, Merrilee, éd. 2018. Leveraging Wikipedia: Connecting Communities of Knowledge. American Library Association.
Scott, Dan. 2017a. « Wikidata Workshop for Librarians ». https://coffeecode.net/wikidata-workshop-for-librarians.html.
———. 2017b. « Wikidata, Canada 150, and Music Festival Data ». https://coffeecode.net/wikidata-canada-150-and-music-festival-data.html.
Statistique Canada. 2023. « Données ouvertes ». Gouvernement du Canada. https://www.statcan.gc.ca/fr/nos-donnees/ou/donnees-ouvertes.
St-Onge, A., et Katrina Cohen-Palacios. 2010/2024. « Mariposa Folk Foundation Fonds ». York University Libraries Clara Thomas Archives and Special Collections. https://atom.library.yorku.ca/index.php/mariposa-folk-foundation-fonds.
Tharani, Karim. 2021. « Much More Than a Mere Technology: A Systematic Review of Wikidata in Libraries ». The Journal of Academic Librarianship 47 (2): 102326. https://doi.org/10.1016/j.acalib.2021.102326.
Van Veen, Theo. 2019. « Wikidata: From “an” Identifier to “the” Identifier ». Information Technology and Libraries 38 (2): 72‑81. https://doi.org/10.6017/ital.v38i2.10886.
Vrandecic, Denny. 2013. « The Rise of Wikidata ». IEEE Intelligent Systems 28 (4): 90‑95. https://doi.org/10.1109/MIS.2013.119.
Waagmeester, Andra, Gregory Stupp, Sebastian Burgstaller-Muehlbacher, Benjamin M Good, Malachi Griffith, Obi L Griffith, Kristina Hanspers, et al. 2020. « Wikidata as a Knowledge Graph for the Life Sciences ». eLife 9 (mars): e52614. https://doi.org/10.7554/eLife.52614.
West End Phoenix. s. d. « West End PhoenixAbout West End Phoenix ». West End Phoenix. Consulté le 28 février 2025. https://www.westendphoenix.com/about-us.
Wikidata. 2021. « The Dirty Shames ». https://www.wikidata.org/wiki/Q84939500.
Wikidata. 2023a. « Aide:Propriétés - Wikidata ». Wikidata. https://www.wikidata.org/w/index.php?title=Help:Properties/fr&oldid=1819612418.
———. 2023b. « Help:Sources - Wikidata ». Wikidata. https://www.wikidata.org/w/index.php?title=Help:Sources/fr&oldid=1846067971.
———. s. d. « Wikidata:Introduction - Wikidata ». Consulté le 28 février 2025. https://www.wikidata.org/wiki/Wikidata:Introduction/fr.
Wikimedia. 2019. « Grants:Project/Smallison/Music in Canada @ 150: A Wikipedia and Wikidata Project - Meta ». https://meta.wikimedia.org/wiki/Grants:Project/Smallison/Music_in_Canada_@_150:_A_Wikipedia_and_Wikidata_Project.
Wikimedia Commons. 2015. « Art Gallery of Ontario. Art+Feminism Wikipedia Edit-A-Thon at AGO, Toronto 15 ». https://commons.wikimedia.org/wiki/File:Art%2BFeminism_Wikipedia_Edit-A-Thon_at_AGO,_Toronto_15.jpg.
Wikipédia. 2024. « Riverboat Coffee House ». Wikipedia, avril. https://en.wikipedia.org/w/index.php?title=Riverboat_Coffee_House&oldid=1220389506.
York University. s. d. « Chair for Research in E-Librarianship 2015-2017 ». York University Libraries. Consulté le 28 février 2025. https://www.library.yorku.ca/web/about-us/wpscott-chair-e-librarianship/chair-for-research-in-e-librarianship-2015-2017/.
Younging, Gregory. 2018. Elements of Indigenous Style: A Guide for Writing By and About Indigenous Peoples. Brush Education.
Zhao, Fudie. 2023. « A Systematic Review of Wikidata in Digital Humanities Projects ». Digital Scholarship in the Humanities 38 (2): 852‑74. https://doi.org/10.1093/llc/fqac083.
Zhu, Lihong, Amanda Xu, Sai Deng, Greta Heng, et Xiaoli Li. 2023. « Entity Management Using Wikidata for Cultural Heritage Information ». Cataloging & Classification Quarterly 61 (1): 20‑46. https://doi.org/10.1080/01639374.2023.2188338.

Contenus additionnels

Wikiprojet Music in Canada at 150

Page du projet Wikipédia et Wikidata de Music in Canada at 150.

Crédits : Wikimédia

Source

Stacy Allison-Cassin

Stacy Allison-Cassin est professeur adjoint au département des sciences de l’information de l’université Dalhousie à Halifax, au Canada. Stacy est un membre actif de la communauté Wikimedia et mène des recherches sur les données liées, les métadonnées et les questions liées à l’équité et à la justice. Stacy est coresponsable du projet de plateforme de terminologie respectueuse et préside actuellement la communauté d’enseignement et d’apprentissage. Elle est également membre du conseil de la National Indigenous Knowledge and Language Association, une association dirigée par des autochtones et basée au Canada, qui siège dans plusieurs organes consultatifs. Citoyenne de la Nation métisse de l’Ontario, Stacy a des liens de parenté avec la communauté métisse de la baie Georgienne.