1 00:00:00,987 --> 00:00:03,588 Panel GLAM 2 00:00:03,588 --> 00:00:06,048 GLAM : galeries d'art, bibliothèques, archives et musées 3 00:00:06,254 --> 00:00:08,249 Bonjour à tous. 4 00:00:08,929 --> 00:00:12,068 Bienvenue à notre panel GLAM. 5 00:00:13,124 --> 00:00:17,009 Avant de commencer, j'ai deux annonces à vous faire. 6 00:00:17,329 --> 00:00:23,049 La première : n'hésitez pas à utiliser notre Etherpad pour prendre des notes. 7 00:00:23,781 --> 00:00:27,998 La deuxième annonce s'adresse à ceux qui nous regardent de chez eux, 8 00:00:27,998 --> 00:00:29,819 ou bien où qu'ils se trouvent : 9 00:00:29,819 --> 00:00:30,958 si vous avez des questions, 10 00:00:30,958 --> 00:00:34,028 vous pouvez également les noter sur l'Etherpad, 11 00:00:34,028 --> 00:00:37,828 et nos bonnes âmes de la salle pourront suivre vos interrogations. 12 00:00:39,328 --> 00:00:44,348 Nous avons donc décidé pour le panel de cette année, 13 00:00:45,388 --> 00:00:48,868 après avoir vu toutes les contributions, 14 00:00:49,128 --> 00:00:52,046 que nous nous concentrerions sur le rôle de Wikidata 15 00:00:52,046 --> 00:00:53,551 dans les écosystèmes de données 16 00:00:53,551 --> 00:00:57,199 qui vont au-delà des projets Wikimedia en cours, 17 00:00:57,199 --> 00:00:59,747 ce qui est également en phase 18 00:00:59,747 --> 00:01:03,677 avec la nouvelle statégie de la fondation Wikimedia. 19 00:01:04,652 --> 00:01:07,947 Et nous sommes accompagnés, aujourd'hui, de quatre membres du panel. 20 00:01:08,387 --> 00:01:09,876 Trois plus un. 21 00:01:09,876 --> 00:01:13,636 Je vais donc vous demander de monter sur scène 22 00:01:13,636 --> 00:01:15,875 afin que je puisse vous présenter à l'assemblée. 23 00:01:16,536 --> 00:01:20,500 (bruits de pas) 24 00:01:22,205 --> 00:01:24,706 Nous avons donc Susanna Ånäs. 25 00:01:25,385 --> 00:01:29,296 Susanna milite depuis très longtemps pour la liberté du savoir, 26 00:01:29,296 --> 00:01:31,276 est engagée dans de nombreux WikiProjects, 27 00:01:31,776 --> 00:01:33,596 et aujourd'hui, elle nous fera le compte-rendu 28 00:01:33,596 --> 00:01:35,526 d'un projet en coopération 29 00:01:35,526 --> 00:01:38,396 avec la Bibliothèque nationale finlandaise. 30 00:01:38,856 --> 00:01:43,435 Ensuite, j'ai à côté de moi Mike Dickison, 31 00:01:43,435 --> 00:01:46,325 qui interviendra en deuxième. 32 00:01:46,995 --> 00:01:50,283 Il est conservateur de musée et est originaire de Nouvelle-Zélande. 33 00:01:50,283 --> 00:01:53,815 Il est également zoologue et rédacteur en chef de Wikipédia. 34 00:01:53,815 --> 00:01:58,788 Il a été le premier Wikipédien néo-zélandais en résidence 35 00:01:58,788 --> 00:02:02,565 en 2018 et 2019, 36 00:02:02,565 --> 00:02:06,634 et il nous parlera de son expérience dans ce rôle, 37 00:02:06,634 --> 00:02:13,105 et ce que cela a fait de travailler pour Wikidata dans ce contexte. 38 00:02:15,784 --> 00:02:18,135 Nous avons ensuite Joachim Neubert 39 00:02:18,135 --> 00:02:23,461 du centre d'information de Leibniz pour l'économie à Kiel et Hambourg. 40 00:02:24,011 --> 00:02:25,601 Il travaille à rendre 41 00:02:25,601 --> 00:02:29,131 les plus grandes archives publiques de la presse au monde 42 00:02:29,131 --> 00:02:31,435 plus accessible au public, 43 00:02:31,435 --> 00:02:34,745 et il utilise Wikidata à cette fin. 44 00:02:35,890 --> 00:02:37,661 J'interviendrai en dernier. 45 00:02:37,661 --> 00:02:39,091 Je m'appelle Beat Estermann. 46 00:02:39,091 --> 00:02:43,080 Je travaille pour l'Université de Berne des sciences appliquées, en Suisse. 47 00:02:43,640 --> 00:02:49,950 Je promeus depuis très longtemps l'OpenGLAM en Suisse et en Autriche, 48 00:02:50,335 --> 00:02:54,280 et je ferai aujourd'hui un compte-rendu de mes activités 49 00:02:54,280 --> 00:02:55,960 en relation avec le mandat 50 00:02:55,960 --> 00:02:59,460 de l'Association canadienne des organismes artistiques, 51 00:02:59,460 --> 00:03:01,270 à savoir les arts du spectacle, 52 00:03:02,121 --> 00:03:04,440 pas nécessairement par le biais de Wikidata, 53 00:03:04,440 --> 00:03:08,421 mais vous verrez qu'il commence à jouer un rôle dans ce domaine. 54 00:03:08,970 --> 00:03:13,250 À présent, la plupart d'entre nous allons prendre place ici, 55 00:03:13,250 --> 00:03:16,980 et je vais donner la parole à Susanna. 56 00:03:17,760 --> 00:03:19,149 (Susanna) Bien. 57 00:03:20,469 --> 00:03:22,769 Bonjour, je m'appelle Susana Ånäs, 58 00:03:22,769 --> 00:03:25,579 et je travaille à temps partiel pour Wikimedia Finlande 59 00:03:25,579 --> 00:03:27,079 en tant que coordinatrice du GLAM, 60 00:03:27,079 --> 00:03:32,655 et je suis également consultante dans le domaine des savoirs libres, 61 00:03:32,655 --> 00:03:36,049 Alors, ça peut être un discours [inaudible], 62 00:03:36,049 --> 00:03:38,719 j'ai donc participé à la réalisation 63 00:03:38,719 --> 00:03:41,940 d'un groupe... 64 00:03:43,132 --> 00:03:46,650 d'un groupe de données géographiques du... 65 00:03:48,439 --> 00:03:51,147 je n'ai pas vérifié le terme en anglais, 66 00:03:51,147 --> 00:03:53,617 mais, c'était à l'initiative du gouvernement royal finlandais 67 00:03:53,617 --> 00:03:54,917 au nom du patrimoine culturel. 68 00:03:54,917 --> 00:03:59,775 Il s'agit donc de noms de lieux 69 00:03:59,775 --> 00:04:03,300 et de la manière dont ils sont représentés 70 00:04:03,300 --> 00:04:07,466 dans différents référentiels du secteur des GLAM en Finlande, 71 00:04:07,466 --> 00:04:11,755 comment les GLAM essaient de rassembler ces différentes sources, 72 00:04:11,755 --> 00:04:15,899 et comment les lieux sont décrits par le biais de la modélisation 73 00:04:15,899 --> 00:04:17,906 dans Wikidata et ailleurs. 74 00:04:17,906 --> 00:04:23,315 On retrouve ici les trois sources principales du projet YSO Places 75 00:04:23,315 --> 00:04:27,944 faisant partie de l'ontologie générale. 76 00:04:27,944 --> 00:04:29,665 AHAA désigne les archives finlandaises, 77 00:04:29,665 --> 00:04:31,645 Melinda, les bibliothèques finlandaises, 78 00:04:31,645 --> 00:04:33,750 et KOOKOS, les musées finlandais. 79 00:04:33,750 --> 00:04:37,585 Il existe donc trois systèmes de gestion de contenu 80 00:04:37,585 --> 00:04:40,290 réunis dans le projet YSO Places. 81 00:04:40,745 --> 00:04:47,365 Des échanges entre Wikidata sont déjà en cours, 82 00:04:47,965 --> 00:04:53,065 ainsi qu'un projet de toponymie pour le Service National Cartographique. 83 00:04:53,065 --> 00:04:56,285 Et puis, il existe un troisième projet, les archives de toponymie finlandaise, 84 00:04:56,285 --> 00:05:00,391 qui n'y contribue pas encore, 85 00:05:00,391 --> 00:05:02,715 mais c'est en prévision. 86 00:05:02,715 --> 00:05:09,175 L'un des points clés de la modélisation dans cette problématique 87 00:05:09,175 --> 00:05:15,226 est que trois types d'éléments de la toponymie des lieux 88 00:05:16,116 --> 00:05:18,195 sont représentés dans ce projet, 89 00:05:18,195 --> 00:05:21,236 l'un d'eux étant le lieu, son emplacement géographique, 90 00:05:21,236 --> 00:05:24,766 un autre étant le nom du lieu, 91 00:05:25,006 --> 00:05:27,696 le dernier étant les sources, c'est-à-dire les documents 92 00:05:27,696 --> 00:05:30,756 d'où ces deux premiers éléments sont tirés, 93 00:05:30,756 --> 00:05:32,565 ou encore, étayés. 94 00:05:32,565 --> 00:05:34,115 Le projet YSO Places, 95 00:05:34,115 --> 00:05:38,799 ici, en haut à droite, on retrouve les mêmes diagrammes 96 00:05:38,799 --> 00:05:41,189 ce projet YSO se concentre principalement sur les lieux. 97 00:05:42,619 --> 00:05:46,279 Ce projet est sous la houlette de la Bibliothèque nationale de Finlande, 98 00:05:46,279 --> 00:05:49,329 et du projet Finto. 99 00:05:50,199 --> 00:05:55,608 Il compte à présent plus de 7 000 lieux en finnois et en suédois, 100 00:05:55,608 --> 00:06:02,318 et plus de 3 000 en anglais, sous licence CC0. 101 00:06:02,772 --> 00:06:06,008 On retrouve ici le service Finto. 102 00:06:06,008 --> 00:06:09,883 Et j'ai choisi pour lieu Sevettijärvi, 103 00:06:09,883 --> 00:06:13,908 qui fait désormais partie de notre projet linguistique 104 00:06:13,908 --> 00:06:15,268 aux côtés des Skolt Sámi.. 105 00:06:15,268 --> 00:06:18,877 Sevettijärvi est un lieu situé dans l'extrême nord de la Finlande, 106 00:06:18,877 --> 00:06:21,765 habité par les Skolt Sámi. 107 00:06:21,765 --> 00:06:27,264 On peut donc voir ici le lieu qui appartient à... 108 00:06:27,264 --> 00:06:32,724 enfin... voilà les données concernant cet endroit. 109 00:06:32,724 --> 00:06:37,952 On peut voir qu'il est relié à un Wikidata, 110 00:06:37,952 --> 00:06:42,344 et retrouver les données du Service National Cartopgraphique. 111 00:06:43,192 --> 00:06:47,406 On voit ici plus en détail ces éléments. 112 00:06:48,582 --> 00:06:52,360 Les données sont également hiérarchisées 113 00:06:52,360 --> 00:06:56,310 dans ce référentiel. 114 00:06:57,670 --> 00:07:00,460 En réalité, ce lieu n'est pas affiché ici, 115 00:07:00,460 --> 00:07:05,880 mais on le retrouve sous cette municipalité, 116 00:07:05,880 --> 00:07:07,880 ainsi que sa région, 117 00:07:07,880 --> 00:07:10,154 et la Finlande en tant que pays, et les pays nordiques, 118 00:07:10,154 --> 00:07:12,650 comme région frontalière. 119 00:07:12,650 --> 00:07:14,400 On peut voir ici que beaucoup de ces données 120 00:07:14,400 --> 00:07:17,891 ont été associées avec Wikidata auparavant, 121 00:07:18,730 --> 00:07:22,230 par le biais d'un Mix'n'Match, et il en reste encore à associer. 122 00:07:22,230 --> 00:07:27,900 Cependant, la quantité d'entrées n'est pas si élevée : 123 00:07:28,411 --> 00:07:30,844 il y a un peu moins de 5 000. 124 00:07:31,570 --> 00:07:33,860 Il existe également cet autre référentiel 125 00:07:33,860 --> 00:07:38,040 du projet de plateforme géospatial finlandaise, 126 00:07:38,040 --> 00:07:39,199 les Place Names Cards. 127 00:07:39,199 --> 00:07:42,130 Ce sont tous les noms de lieux qui figurent sur les cartes finlandaises. 128 00:07:42,130 --> 00:07:48,308 Les données qui y sont reliées, sont sous licence CC BY 4.0. 129 00:07:48,518 --> 00:07:52,628 Ce sont 800 000 étiquettes de cartes en finnois, suédois, 130 00:07:52,628 --> 00:07:55,778 et dans les trois langues sámi que l'on parle en Finlande. 131 00:07:55,997 --> 00:07:58,877 Et il existe deux types d'entités : 132 00:07:58,877 --> 00:08:02,651 certaines sont des lieux, et les autres des noms de lieux. 133 00:08:02,651 --> 00:08:05,271 Et elles ont toutes deux leur adresse PURL. 134 00:08:06,001 --> 00:08:09,721 Par exemple, ici, ce même Sevettijärvi, apparaît en finnois, à la première ligne, 135 00:08:09,721 --> 00:08:12,141 puis dans les trois langues sámi, 136 00:08:12,141 --> 00:08:17,301 ainsi que ses données géographiques, et davantage d'informations 137 00:08:17,301 --> 00:08:20,841 comme le type de lieu, et ainsi de suite. 138 00:08:21,640 --> 00:08:28,815 Voici le tableau pour cette toponymie ayant son propre URI. 139 00:08:29,943 --> 00:08:33,738 Désolé, apparemment, ça n'est pas traduit en anglais... 140 00:08:34,432 --> 00:08:39,151 Il semblerait que le multilinguisme ne couvre pas l'ensemble du projet. 141 00:08:40,057 --> 00:08:42,523 Nous arrivons ensuite à l'archivage des toponymes finlandais. 142 00:08:42,523 --> 00:08:46,234 Il s'agit d'un projet mené par l'Institut de langues de Finlande, 143 00:08:46,234 --> 00:08:50,456 qui ne traite ni des lieux, ni de leur toponymes, 144 00:08:50,456 --> 00:08:52,603 mais des sources de ces derniers. 145 00:08:52,603 --> 00:08:57,123 Il s'agit donc de trois millions de notes sur le terrain des noms de lieux, 146 00:08:57,723 --> 00:08:59,529 et il s'agit d'un projet Wikibase. 147 00:08:59,529 --> 00:09:01,139 Ces données sont dans une Wikibase, 148 00:09:01,139 --> 00:09:03,325 principalement en finnois, certaines en suédois, 149 00:09:03,325 --> 00:09:08,111 dans quantité de langues sámi d'intérêt, 150 00:09:08,111 --> 00:09:10,141 et elles sont sous licence CC BY 4.0, 151 00:09:10,380 --> 00:09:14,850 ce qui représente également un défi du point de vue Wikidata, 152 00:09:14,850 --> 00:09:17,640 mais s'il existait une Wikibase locale finlandaise, 153 00:09:17,640 --> 00:09:22,632 nous serions peut-être en mesure de les travailler en premier. 154 00:09:23,034 --> 00:09:25,343 Voici donc une capture d'écran 155 00:09:26,443 --> 00:09:31,323 montrant qu'il y a des informations concernant le lieu, les cartes... 156 00:09:31,323 --> 00:09:35,227 et des anciennes cartes que les collectionneurs utilisaient, 157 00:09:35,227 --> 00:09:40,713 ainsi que des cartes générées sur la base des données récoltées. 158 00:09:41,455 --> 00:09:46,416 Voici donc une de ces cartes 159 00:09:46,416 --> 00:09:50,186 générée sur base des données. 160 00:09:51,166 --> 00:09:53,301 Nous avons également ce projet 161 00:09:53,301 --> 00:09:56,336 mené par le Laboratoire des humanités numériques d'Helsinki 162 00:09:56,336 --> 00:10:01,446 et le groupe de recherche en sémantique informatique de l'université d'Aalto, 163 00:10:01,446 --> 00:10:06,525 en partenariat avec l'Institut de langues de Finlande, 164 00:10:06,525 --> 00:10:07,994 le projet Names Sampo. 165 00:10:07,994 --> 00:10:11,024 Et il s'agit d'une interface de recherche agrégée 166 00:10:11,024 --> 00:10:13,503 selon plusieurs sources de toponymie. 167 00:10:13,503 --> 00:10:17,704 Ici, on peut voir nombre de sources à gauche de l'écran, 168 00:10:17,704 --> 00:10:20,763 et on peut générer différentes représentations 169 00:10:20,763 --> 00:10:22,653 sur la base de ces données. 170 00:10:22,653 --> 00:10:24,438 Et... oui, c'est ça. 171 00:10:25,289 --> 00:10:30,603 J'ai donc évoqué cette idée de modélisation d'une Wikibase locale 172 00:10:30,603 --> 00:10:32,693 que nous pourrions réaliser avec ces données. 173 00:10:32,693 --> 00:10:36,280 Mais lorsque nous évoquons ces questions de modélisation, 174 00:10:36,280 --> 00:10:37,770 ou comment modéliser, 175 00:10:37,770 --> 00:10:41,589 il y existe différentes manières de procéder. 176 00:10:42,105 --> 00:10:43,693 Et donc... 177 00:10:44,662 --> 00:10:45,682 Oui. 178 00:10:45,682 --> 00:10:48,160 Ce qu'il y a de bien, 179 00:10:48,160 --> 00:10:50,569 c'est que cela pourrait servir les langues minoritaires 180 00:10:50,569 --> 00:10:52,593 avec très peu d'efforts. 181 00:10:53,243 --> 00:10:57,179 Très bien, nous avons donc ici deux options : 182 00:10:57,179 --> 00:11:01,660 le modèle SAPO, c'est-à-dire l'ontologie spatio-temporelle finlandaise, 183 00:11:02,841 --> 00:11:04,421 et le modèle Wikidata. 184 00:11:04,421 --> 00:11:06,909 On peut voir ici que les éléments Wikidata ont tendance à... 185 00:11:06,909 --> 00:11:12,871 eh bien, dans l'idéal, rester identiques avec des propriétés changeantes, 186 00:11:12,871 --> 00:11:16,909 alors que, dans le modèle SAPO, ces éléments deviennent nouveaux 187 00:11:16,909 --> 00:11:20,399 lorsqu'il y a un changement, comme un changement de zone ou de nom. 188 00:11:21,179 --> 00:11:26,219 Revenons à ce schéma divisé 189 00:11:26,219 --> 00:11:31,719 entre ces trois différentes dimensions. 190 00:11:32,099 --> 00:11:35,869 Ainsi, devrions-nous faire de ces toponymes 191 00:11:35,869 --> 00:11:37,659 des entités ou des propriétés ? 192 00:11:37,659 --> 00:11:39,248 Wikidata utilise des propriétés, 193 00:11:39,248 --> 00:11:43,098 tandis que le Service National Cartopgraphique parle d'entités. 194 00:11:43,838 --> 00:11:46,177 Ou devrions-nous en faire des lexèmes ? 195 00:11:46,177 --> 00:11:52,106 Wikidata a choisi de travailler avec des propriétés textuelles 196 00:11:52,106 --> 00:11:54,956 pour les toponymes plutôt que des lexèmes. 197 00:11:55,567 --> 00:11:57,818 Je suis désolée, c'est l'inverse. 198 00:11:57,818 --> 00:11:59,631 Donc, les noms sont... 199 00:12:03,056 --> 00:12:04,941 des propriétés, pas des lexèmes. 200 00:12:05,874 --> 00:12:06,877 Bien. 201 00:12:07,165 --> 00:12:11,132 Je dirais que la faiblesse de la Wikibase 202 00:12:11,132 --> 00:12:16,340 est peut-être l'absence de données topographiques 203 00:12:16,340 --> 00:12:20,958 comme dans la configuration de base, 204 00:12:20,958 --> 00:12:24,748 il faudrait donc rendre le système plus performant 205 00:12:24,748 --> 00:12:29,688 pour pouvoir utiliser les topographies locales. 206 00:12:29,688 --> 00:12:31,823 Et une fédération serait vraiment la bienvenue 207 00:12:31,823 --> 00:12:38,048 pour pouvoir profiter du corpus Wikidata. 208 00:12:38,648 --> 00:12:41,926 Donc, je crois bien être arrivée à la fin de la présentation ! 209 00:12:41,926 --> 00:12:43,058 Merci ! 210 00:12:43,616 --> 00:12:45,827 (applaudissements) 211 00:12:49,381 --> 00:12:52,071 (bruits de pas) 212 00:13:01,255 --> 00:13:02,514 Bien. 213 00:13:03,274 --> 00:13:05,011 (s'exprimant en maori) 214 00:13:05,011 --> 00:13:06,165 (Mike) Bienvenue à tous. 215 00:13:06,165 --> 00:13:08,375 Je m'appelle Mike Dickison. 216 00:13:08,375 --> 00:13:10,149 Et durant un an, 217 00:13:10,149 --> 00:13:13,075 j'ai été un wikipédien néo-zélandais en résidence. 218 00:13:13,935 --> 00:13:16,935 Vous vous demandez peut-être ce qu'est un wikipédien en résidence, 219 00:13:17,856 --> 00:13:20,825 parce que si vous cherchez, vous ne trouverez rien à ce sujet, 220 00:13:20,825 --> 00:13:22,275 comme on peut le voir ici. 221 00:13:22,735 --> 00:13:25,855 C'est un terme que j'ai inventé dans la proposition de subvention, 222 00:13:26,153 --> 00:13:29,003 ce que la fondation a semblé beaucoup apprécier. 223 00:13:29,983 --> 00:13:31,533 Et donc, nous avons gardé ce terme. 224 00:13:32,303 --> 00:13:36,633 Durant un an, je suis passé par 35 institutions différentes, 225 00:13:37,053 --> 00:13:41,053 les résidences qui, pour la plupart, organisaient des sessions de formation, 226 00:13:41,493 --> 00:13:44,363 des événements publics, et essayaient de développer 227 00:13:44,363 --> 00:13:47,230 une stratégie Wikimedia, chacune de leur côté. 228 00:13:47,808 --> 00:13:49,498 Ça a été une expérience très intéressante, 229 00:13:49,498 --> 00:13:53,267 où j'ai découvert un large éventail de projets et de personnes, 230 00:13:53,267 --> 00:13:58,211 et j'aimerais passer en revue quelques-uns des différents projets 231 00:13:58,211 --> 00:14:00,345 qui portaient sur Wikidata, 232 00:14:00,872 --> 00:14:05,171 d'une manière intéressante, ou tout au moins éclairante, 233 00:14:05,171 --> 00:14:07,181 dont les gens pourront débattre. 234 00:14:07,181 --> 00:14:08,621 Le projet était axé sur Wikipedia... 235 00:14:08,621 --> 00:14:11,961 Le projet était initialement estampillé Wikipédia 236 00:14:11,961 --> 00:14:14,651 simplement parce que les gens étaient familiers de Wikipedia, 237 00:14:15,281 --> 00:14:18,360 et nous avons donc organisé de multiples événements différents 238 00:14:18,360 --> 00:14:23,135 lors d'edit-a-thons traditionnels sur les écarts entre les sexes... 239 00:14:24,607 --> 00:14:26,752 [dont beaucoup ont été très fructueux], 240 00:14:27,105 --> 00:14:30,812 ainsi qu'une série recrutement de rédacteurs en chef tout aussi réussie. 241 00:14:31,754 --> 00:14:34,454 Nous avons effectué des téléchargements en masse vers les Commons. 242 00:14:35,454 --> 00:14:41,246 En l'occurrence ici, une collection de plus de 1 000 œuvres d'art originales 243 00:14:41,246 --> 00:14:46,047 de l'illustrateur entomologiste, Des Helmore, 244 00:14:46,047 --> 00:14:47,927 qui se trouvait sur un disque dur, 245 00:14:47,927 --> 00:14:50,167 qui correspondait à une décennie de recherche, 246 00:14:50,167 --> 00:14:52,322 et nous avons pu obtenir l'autorisation de les publier 247 00:14:52,322 --> 00:14:54,245 le tout sous licence CC BY. 248 00:14:54,245 --> 00:14:57,963 Donc, de petites victoires que nous avons pu montrer aux gens de là-bas. 249 00:14:57,963 --> 00:15:01,095 Tout le monde peut comprendre des images de coléoptères. 250 00:15:01,095 --> 00:15:02,850 Tout le monde peut comprendre 251 00:15:02,850 --> 00:15:07,250 les ateliers consacrés à la réduction de l'écart entre les sexes. 252 00:15:07,250 --> 00:15:10,251 Mais Wikidata est beaucoup plus difficile à vendre 253 00:15:10,251 --> 00:15:12,280 aux personnes du secteur GLAM, 254 00:15:12,280 --> 00:15:15,005 ou toute personne extérieure de notre mouvement. 255 00:15:16,107 --> 00:15:19,717 J'ai donc commencé à réaliser que Wikidata 256 00:15:19,717 --> 00:15:22,634 allait devenir une voie de plus en plus importante 257 00:15:22,634 --> 00:15:25,883 dans ces projets de wikipédiens en résidence. 258 00:15:25,883 --> 00:15:28,232 Ainsi, au fur et à mesure que nous avancions, 259 00:15:28,232 --> 00:15:31,849 cette composante a pris de plus en plus d'importance dans mon travail, 260 00:15:31,849 --> 00:15:36,350 et j'ai commencé à essayer d'en apprendre plus sur Wikidata moi-même, 261 00:15:36,800 --> 00:15:39,515 parce que je commençais à en comprendre l'importance. 262 00:15:40,287 --> 00:15:41,989 Donc, voici un projet... 263 00:15:41,989 --> 00:15:46,325 le kakapo est un perroquet grimpeur endémique de Nouvelle-Zélande. 264 00:15:48,096 --> 00:15:51,335 Nous avons travaillé en partenariat avec le Ministère de la conservation, 265 00:15:51,335 --> 00:15:54,299 dont le travail est de sauver cette espèce de l'extinction, 266 00:15:54,299 --> 00:15:55,643 et l'idée était : 267 00:15:55,643 --> 00:15:59,253 « Et si nous référencions chaque kakapo dans Wikidata ? » 268 00:16:01,221 --> 00:16:02,701 Cela peut sembler risible, 269 00:16:02,701 --> 00:16:05,580 mais c'est en fait un projet parfaitement réalisable. 270 00:16:05,981 --> 00:16:08,427 Quelques-uns d'entre eux y sont déjà. 271 00:16:09,100 --> 00:16:11,601 Un élément clé à noter ici est qu'il n'y a très peu de kakapos. 272 00:16:11,615 --> 00:16:13,245 C'est donc une tâche gérable. 273 00:16:13,245 --> 00:16:16,656 Il y en existait 148 quand j'ai commencé, un est mort depuis, 274 00:16:16,935 --> 00:16:19,001 et la dernière saison de reproduction a été bonne 275 00:16:19,001 --> 00:16:21,765 puisqu'on en dénombre 213 à présent. 276 00:16:21,765 --> 00:16:25,045 C'est formidable car on n'avait pas atteint ce nombre depuis plus de 50 ans. 277 00:16:25,505 --> 00:16:28,260 Ça a été une grosse affaire, 278 00:16:28,260 --> 00:16:30,725 ça faisait les manchettes tous les jours en Nouvelle-Zélande. 279 00:16:31,285 --> 00:16:32,694 Et... oui ? 280 00:16:32,694 --> 00:16:34,414 (intervenant·e 1) Même le New York Times ! 281 00:16:34,414 --> 00:16:35,673 (Mike) Vraiment ? Merveilleux. 282 00:16:35,673 --> 00:16:38,522 Oui, ça a eu une ampleur nationale, tout le monde aime ces oiseaux. 283 00:16:39,002 --> 00:16:40,663 Mais ce qui les rend intéressants, 284 00:16:40,663 --> 00:16:43,932 c'est que, contrairement aux espèces qui sont plus peuplées, 285 00:16:43,932 --> 00:16:49,817 chaque kakapo a un nom et un numéro d'identification propre, 286 00:16:49,817 --> 00:16:52,442 et on dispose souvent de données biographiques complètes 287 00:16:52,442 --> 00:16:54,672 sur le lieu et la date de leur naissance, 288 00:16:54,672 --> 00:16:56,972 où ils ont été couvés, qui étaient le père et la mère, 289 00:16:56,972 --> 00:16:58,713 quand ils sont morts, s'ils sont morts. 290 00:16:58,713 --> 00:17:01,312 Il existe donc une base de données au Ministère de la conservation 291 00:17:01,312 --> 00:17:02,882 qui répertorie toutes ces informations. 292 00:17:02,882 --> 00:17:06,723 Et l'un des plus célèbres kakapos, bien entendu, est Sirocco, 293 00:17:06,723 --> 00:17:09,726 qui, comme vous pouvez le voir, est nommé d'après le vent. 294 00:17:09,726 --> 00:17:13,225 Sirocco a un compte Twitter, 295 00:17:13,705 --> 00:17:15,927 avec lequel Wikidata rencontrait quelques problèmes, 296 00:17:15,927 --> 00:17:17,162 parce que, apparemment, 297 00:17:17,162 --> 00:17:20,342 ils ne peuvent tout simplement pas avoir de compte Twitter, bref. 298 00:17:21,121 --> 00:17:23,456 Il a même fait la couverture d'un album, et cetera. 299 00:17:23,456 --> 00:17:25,716 Il y a donc eu de multiples propriétés à cela, 300 00:17:25,716 --> 00:17:28,258 à probablement l'un des plus célèbres kakapo. 301 00:17:28,258 --> 00:17:30,337 J'ai donc proposé au Ministère de la conservation : 302 00:17:30,337 --> 00:17:33,245 « Pourquoi n'essayons-nous pas de faire cela avec chacun d'entre eux ? » 303 00:17:33,245 --> 00:17:37,665 Alors, il leur a fallu réfléchir à combien des données biographiques 304 00:17:37,665 --> 00:17:39,365 pourraient être rendues publiques, 305 00:17:39,365 --> 00:17:41,225 et ils ont présenté une liste. 306 00:17:41,225 --> 00:17:45,094 Et maintenant nous en avons, je crois, 212 ou 210... 307 00:17:45,094 --> 00:17:46,644 je crois qu'un couple est mort... 308 00:17:46,644 --> 00:17:50,333 kakapo vivants qui sont à présent tous candidats. 309 00:17:50,333 --> 00:17:52,933 Et ils ne reçoivent un nom que lorsqu'ils se couvrent de plumes, 310 00:17:52,933 --> 00:17:56,172 un code leur donné tant qu'il sont bébés. 311 00:17:56,172 --> 00:17:58,227 Donc, une fois la récolte de données complète, 312 00:17:58,227 --> 00:18:01,806 nous allons créer un Wikidata complet... 313 00:18:01,806 --> 00:18:04,225 l'espèce entière sera référencée dans Wikidata. 314 00:18:04,426 --> 00:18:06,605 Mais on doit arriver à une propriété pour *DOC ID*... 315 00:18:06,605 --> 00:18:08,875 En fait, j'aimerais évoquer ce sujet avec vous : 316 00:18:08,875 --> 00:18:11,266 devrions-nous utiliser une identification très spécifique 317 00:18:11,266 --> 00:18:14,216 ou devrions-nous trouver une identité qui fonctionnerait 318 00:18:14,216 --> 00:18:21,375 pour tous les oiseaux, plantes ou animaux sujets de projets scientifique ? 319 00:18:21,965 --> 00:18:23,795 C'est une bonne question. 320 00:18:25,105 --> 00:18:27,695 Le deuxième projet concernait la galerie d'art de Christchurch. 321 00:18:28,225 --> 00:18:31,523 Il y existe très peu de peintures de Colin MacCahon, 322 00:18:31,523 --> 00:18:33,963 c'est l'un des plus célèbres artistes de l'existence. 323 00:18:33,963 --> 00:18:36,704 Voici un dessin qu'il a fait pour le New Zealand School Journal, 324 00:18:36,704 --> 00:18:38,424 financé par le gouvernement de l'époque. 325 00:18:38,424 --> 00:18:40,704 Il fait donc partie des archives de Nouvelle-Zélande 326 00:18:40,704 --> 00:18:42,294 qui en détiennent les droits d'auteur. 327 00:18:42,294 --> 00:18:44,333 C'est une situation très inhabituelle. 328 00:18:44,774 --> 00:18:47,073 J'ai donc travaillé avec la galerie d'art de Christchurch, 329 00:18:47,073 --> 00:18:48,993 qui, avec la galerie d'art d'Auckland, 330 00:18:48,993 --> 00:18:52,954 posséde un site appelé « Trouvez des artistes néo-zélandais », 331 00:18:52,954 --> 00:18:55,478 dont la tâche est de garder une trace des exploitations... 332 00:18:55,478 --> 00:18:58,403 de chaque institution possédant des propriétés d'artistes néo-zélandais, 333 00:18:58,403 --> 00:19:03,163 soit une base données d'environ 18 000 artistes, 334 00:19:03,163 --> 00:19:05,517 dont la majorité est très peu documentée. 335 00:19:06,233 --> 00:19:08,992 Nous avons donc procédé à une sorte de Mix'n'Match standard. 336 00:19:08,992 --> 00:19:12,133 Nous avons exporté les données ayant au moins 337 00:19:12,133 --> 00:19:17,545 une date de naissance ou de décès, ou un lieu de naissance ou de mort. 338 00:19:17,545 --> 00:19:20,614 Donc, le champs était large. 339 00:19:20,614 --> 00:19:23,484 Or, même là, on en a extrait peu, 340 00:19:23,484 --> 00:19:25,954 mais aujourd'hui, nous en avons environ 1 500 341 00:19:25,954 --> 00:19:28,603 reliés à des artistes connus dans Wikidata, 342 00:19:28,603 --> 00:19:30,123 ce qui est bien. 343 00:19:30,123 --> 00:19:31,783 Mais ce qui les intéressait... 344 00:19:31,783 --> 00:19:33,523 Voici leur site web, 345 00:19:33,523 --> 00:19:39,213 qui ne fait que répertorier les liens d'exploitation, 346 00:19:39,213 --> 00:19:44,523 sachant qu'il créent manuellement ces données biographiques 347 00:19:44,523 --> 00:19:46,063 pour chaque artiste, 348 00:19:46,063 --> 00:19:48,803 eh bien, l'acte d'exporter et la mise en place d'un Mix'n'Match 349 00:19:48,803 --> 00:19:52,363 a mis en lumière de nombreuses coquilles et toute sorte d'erreurs, 350 00:19:52,363 --> 00:19:53,723 qu'ils n'avaient pas remarquées. 351 00:19:53,723 --> 00:19:56,123 Et ce n'est que qu'en traitant les données dans un Excel 352 00:19:56,123 --> 00:19:57,272 que les erreurs ressortent. 353 00:19:57,272 --> 00:20:01,520 Et ils ont tout à coup réalisé la valeur de Wikidata 354 00:20:01,520 --> 00:20:02,547 quand je leur ai dit : 355 00:20:02,547 --> 00:20:06,537 « Il vous suffit de pomper ces informations de Wikidata ». 356 00:20:06,548 --> 00:20:09,507 Ça leur a ouvert les yeux. 357 00:20:09,507 --> 00:20:11,748 Je pense donc que c'est un des arguments vendeurs. 358 00:20:11,748 --> 00:20:14,907 Lorsque vous avez un site web soigneusement créé à la main, 359 00:20:14,907 --> 00:20:17,154 avec 18 000 entrées pleines d'erreurs, 360 00:20:17,154 --> 00:20:19,344 et qu'on vous dit qu'il existe un autre moyen, 361 00:20:19,344 --> 00:20:23,192 que d'autres personnes peuvent vérifier et corriger pour vous les informations, 362 00:20:23,192 --> 00:20:24,813 c'est là que l'idée fait son chemin. 363 00:20:25,143 --> 00:20:30,083 Et puis, je leur ai lancé l'idée de « Wikidatafier » l'intégralité ce livre 364 00:20:30,083 --> 00:20:33,333 sur l'histoire des artistes néo-zélandais à Christchurch dans les années 30, 365 00:20:33,333 --> 00:20:39,453 et de passer en revue chaque personne, lien, lieu, exposition, et cetera. 366 00:20:39,453 --> 00:20:43,103 C'est un projet de taille raisonnable, et ils sont très enthousiastes. 367 00:20:43,943 --> 00:20:46,843 Et troisièmement, je voulais vous montrer le projet des rubriques Maori. 368 00:20:46,843 --> 00:20:50,811 *Waka* est le nom maori qui désigne un certain type de canoë, 369 00:20:50,811 --> 00:20:52,732 un canoë de guerre. 370 00:20:52,732 --> 00:20:55,812 Ainsi, à la Bibliothèque nationale de la Nouvelle-Zélande, 371 00:20:55,812 --> 00:20:57,090 il existe une entrée pour *waka*, 372 00:20:57,090 --> 00:21:00,925 parce que la Bibliothèque nationale a en réalité son propre dictionnaire 373 00:21:00,925 --> 00:21:04,234 des rubriques Maori, en langue maori. 374 00:21:04,234 --> 00:21:09,755 Donc, ici, il définit le *waka* en maori et en anglais. 375 00:21:10,182 --> 00:21:12,372 Mais il comporte également beaucoup de termes maoris... 376 00:21:12,372 --> 00:21:16,237 on peut voir ici, sur le côté, une taurapa maorie typique. 377 00:21:16,237 --> 00:21:19,774 La définition apparaît d'abord en maori, puis en anglais. 378 00:21:19,774 --> 00:21:22,475 Ce qu'on voit ici, c'est un étambot sculpté. 379 00:21:22,475 --> 00:21:24,252 En français, on appellerait cela « étambot », 380 00:21:24,252 --> 00:21:26,989 mais on ne peut pas utiliser le mot « étambot » pour une taurapa, 381 00:21:26,989 --> 00:21:28,750 car on ne voit la taurapa 382 00:21:28,750 --> 00:21:31,420 que sur certains types de canoës de guerre. 383 00:21:31,420 --> 00:21:34,460 Donc, il n'existe pas d'équivalent en français. 384 00:21:35,108 --> 00:21:36,909 Et j'ai soudain réalisé qu'il y avait ici 385 00:21:36,909 --> 00:21:39,929 toute une ontologie de termes spécifiques à la culture 386 00:21:39,929 --> 00:21:42,867 qui ont été soigneusement répertoriés et vérifiés 387 00:21:42,867 --> 00:21:45,043 par la Bibliothèque nationale avec les Maoris, 388 00:21:45,043 --> 00:21:49,733 régulièrement mis à jour et suppléés par des définitions et des descriptions, 389 00:21:49,733 --> 00:21:51,803 en anglais et en maori. 390 00:21:51,803 --> 00:21:52,956 Vraiment passionnant ! 391 00:21:52,956 --> 00:21:56,228 J'ai soudain pensé que nous pourrions injecter tout cela dans Wikidata, 392 00:21:56,228 --> 00:21:57,993 en maori d'abord, 393 00:21:57,993 --> 00:22:00,596 puis traduits en anglais, selon les besoins, 394 00:22:00,596 --> 00:22:02,291 ça change un peu, n'est-ce pas ? 395 00:22:03,081 --> 00:22:05,046 Voici la licence de droit d'auteur. 396 00:22:05,046 --> 00:22:08,726 Et malheureusement, elle en empêche l'exploitation commerciale. 397 00:22:10,346 --> 00:22:14,626 Je dois reprendre les échanges avec eux : pourquoi ont-ils choisi cette license ? 398 00:22:15,675 --> 00:22:19,970 Peut-être parce qu'ils ont [négocié] avec les Maoris, 399 00:22:19,970 --> 00:22:22,679 qui ont accepté la diffusion de ces informations 400 00:22:22,679 --> 00:22:27,149 à condition qu'aucune de ces informations ne soit utilisée à des fins commerciales. 401 00:22:27,920 --> 00:22:31,999 C'est donc l'un des aspects les plus frustrants de cette tâche : 402 00:22:31,999 --> 00:22:34,238 se heurter à ce genre de restrictions. 403 00:22:34,238 --> 00:22:36,869 Voici donc les trois projets que je voulais mettre en avant 404 00:22:36,869 --> 00:22:38,379 et ouvrir à la discussion. 405 00:22:38,379 --> 00:22:40,878 Répertorier une espèce entière dans Wikidata, 406 00:22:40,878 --> 00:22:44,107 ce qu'il faut pour changer la vision d'un conservateur de galerie d'art 407 00:22:44,107 --> 00:22:46,078 sur la valeur des Wikidatas, 408 00:22:46,078 --> 00:22:49,838 et que faire lorsque nous voyons une ontologie entière 409 00:22:49,838 --> 00:22:51,277 dans une autre langue qui, 410 00:22:51,277 --> 00:22:55,697 malheureusement, est freinée par une licence Creative Commons. 411 00:22:55,697 --> 00:22:56,997 Je vous remercie. 412 00:22:56,997 --> 00:22:58,737 (applaudissements) 413 00:23:04,574 --> 00:23:07,024 Faire don de données à Wikidata : 414 00:23:07,024 --> 00:23:09,664 première expérience avec les archives de presse du 20e siècle. 415 00:23:11,412 --> 00:23:14,077 (Joachim) Bonjour ! Je m'appelle Joachim Neubert. 416 00:23:14,077 --> 00:23:16,472 Je travaille pour la ZBW, 417 00:23:17,522 --> 00:23:20,947 c'est-à-dire le centre d'information pour l'économie à Hambourg, 418 00:23:21,407 --> 00:23:24,306 en tant que développeur de logiciels scientifiques. 419 00:23:24,726 --> 00:23:27,248 Et une de mes tâches l'année dernière 420 00:23:27,248 --> 00:23:31,408 a été de préparer un don de données à Wikidata. 421 00:23:31,878 --> 00:23:37,193 Je voudrais donc faire un compte-rendu de cette première expérience 422 00:23:37,613 --> 00:23:43,259 de don de métadonnées des archives de presse du 20e siècle. 423 00:23:46,463 --> 00:23:48,299 À notre connaissance, 424 00:23:48,299 --> 00:23:52,678 il s'agit des plus grandes archives de presse publiques dans le monde. 425 00:23:54,018 --> 00:23:59,158 Elles ont été collectées entre 1908 et 2005, 426 00:24:01,008 --> 00:24:04,244 et ont été obtenues de... 427 00:24:05,174 --> 00:24:10,312 de plus de 1 500 journaux et périodiques d'Allemagne, 428 00:24:10,312 --> 00:24:13,333 mais aussi à l'échelle internationale. 429 00:24:14,651 --> 00:24:18,841 Et elles couvrent tout ce qui pourrait présenter un intérêt 430 00:24:18,841 --> 00:24:22,820 pour Hambourg... 431 00:24:25,870 --> 00:24:28,030 pour les hommes d'affaires de Hambourg 432 00:24:28,030 --> 00:24:32,410 qui voudraient développer leur commerce à travers le monde. 433 00:24:34,611 --> 00:24:36,550 Comme vous pouvez le constater, 434 00:24:36,550 --> 00:24:41,790 les contenus ont été découpés des journaux et fixés sur des feuilles, 435 00:24:41,790 --> 00:24:44,731 puis rassemblés dans des dossiers, 436 00:24:45,211 --> 00:24:50,451 comme ici, on aperçoit une partie d'une pièce d'archive, 437 00:24:51,255 --> 00:24:56,182 et, de même, l'information qui a été collectée des entreprises, 438 00:24:56,182 --> 00:24:59,762 sur des sujets généraux, sur... 439 00:24:59,762 --> 00:25:01,533 (bafouillements) 440 00:25:01,533 --> 00:25:05,557 sur tout ce qui pourrait être intéressant. 441 00:25:06,978 --> 00:25:11,074 Ces dossiers ont été scannés 442 00:25:12,652 --> 00:25:15,868 jusqu'à l'année 1949 environ, 443 00:25:17,076 --> 00:25:23,123 dans le cadre d'un projet financé par la DFG de 2004 à 2007. 444 00:25:24,268 --> 00:25:30,591 Par conséquent, jusqu'à présent, ce sont 25 000 dossiers thématiques 445 00:25:31,727 --> 00:25:33,759 de cette époque qui ont été scannés. 446 00:25:33,771 --> 00:25:37,913 Les archives contiennent un peu plus de 2 millions de pages, 447 00:25:38,845 --> 00:25:41,522 et on peut les retrouver sur Internet 448 00:25:43,633 --> 00:25:48,461 grâce à l'application développée à l'époque par ZBW, 449 00:25:50,006 --> 00:25:55,931 qui semble aujourd'hui un peu dépassée, n'est pas très agréable à regarder, 450 00:25:55,931 --> 00:25:58,597 mais plus qu'un programme, 451 00:25:58,597 --> 00:26:04,350 c'est une application qui a été construite avec une architecture Oracle, 452 00:26:04,350 --> 00:26:08,662 elle a été construite sur ColdFusion, elle fonctionne sur des serveurs Windows, 453 00:26:09,227 --> 00:26:14,992 elle n'est donc pas très viable à long terme. 454 00:26:16,008 --> 00:26:19,384 Nous nous sommes demandés si nous devions la migrer 455 00:26:19,384 --> 00:26:22,755 vers une application de données ouvertes liées plus sophistiquée, 456 00:26:23,931 --> 00:26:27,964 ou si nous devions prendre des mesures radicales 457 00:26:27,964 --> 00:26:31,749 et mettre toutes ces données en consultation libre. 458 00:26:32,843 --> 00:26:37,416 Nous avons attribué une licence CC0 à ces données 459 00:26:37,416 --> 00:26:40,938 et nous déplaçons actuellement certaines... 460 00:26:42,036 --> 00:26:46,463 certaines couches -- principale et primaire -- de découvertes... 461 00:26:47,233 --> 00:26:50,587 vers des données ouvertes liées 462 00:26:51,315 --> 00:26:53,801 là où... 463 00:26:53,801 --> 00:27:00,580 cela a le plus de sens d'intégrer des métadonnées dans Wikidata, 464 00:27:02,367 --> 00:27:06,781 et afin de s'assurer que tous les dossiers 465 00:27:07,594 --> 00:27:10,633 des collections sont reliés à Wikidata 466 00:27:11,485 --> 00:27:13,308 pour qu'ils soient trouvables, 467 00:27:14,240 --> 00:27:17,795 et que toutes les métadonnées concernant ces dossiers 468 00:27:18,444 --> 00:27:22,977 soient également transférées sur Wikidata. 469 00:27:23,344 --> 00:27:27,886 Elles pourront donc y être utilisées, et éventuellement enrichies, 470 00:27:28,780 --> 00:27:32,237 des corrections pourront être apportées à ces données. 471 00:27:32,645 --> 00:27:36,224 Mais ZBW continuera de gérer l'application 472 00:27:36,224 --> 00:27:39,274 et prendre en charge le coût de stockage des images 473 00:27:39,947 --> 00:27:43,882 auxquelles nous ne pouvons pas, de quelque manière que ce soit, 474 00:27:45,548 --> 00:27:47,326 attribuer de licence, 475 00:27:47,326 --> 00:27:51,179 parce qu'elles restent la propriété de leurs créateurs d'origine. 476 00:27:52,271 --> 00:27:54,954 Mais nous veillerons à ce qu'elles soient accessibles 477 00:27:56,500 --> 00:28:02,138 à certains fichiers de métadonnées via DFG Viewer 478 00:28:03,108 --> 00:28:06,108 à l'avenir par les manifestes de l'IIIF. 479 00:28:06,849 --> 00:28:11,050 Et nous allons mettre en place quelques pages d'atterrissage statiques 480 00:28:11,707 --> 00:28:18,333 qui serviront de point de données de référence pour Wikidata, 481 00:28:18,333 --> 00:28:22,596 tout en continuant à mettre à disposition des données 482 00:28:22,600 --> 00:28:26,174 qui ne s'intègrent pas bien dans Wikidata. 483 00:28:31,253 --> 00:28:36,815 Pour nous, il s'agit de la migration et du don de données à Wikidata 484 00:28:37,165 --> 00:28:42,873 grâce notre infrastructure sur mesure de points de terminaison SPARQL 485 00:28:42,873 --> 00:28:44,837 de ces données, 486 00:28:45,887 --> 00:28:49,100 et nous avons essentiellement utilisé des requêtes fédérées 487 00:28:49,990 --> 00:28:53,834 entre les points de terminaison et le service de recherche Wikidata 488 00:28:53,834 --> 00:28:57,633 pour créer des déclarations concordantes 489 00:28:59,207 --> 00:29:02,107 au travers de [résultats] concaténés 490 00:29:02,107 --> 00:29:06,937 dans les requêtes SPARQL elles-mêmes, ou transformés par un script, 491 00:29:07,907 --> 00:29:12,254 ce qui a également généré des références pour ces déclarations 492 00:29:12,742 --> 00:29:17,496 et on a ensuite intégré cela aux QuickStatements du code 493 00:29:17,496 --> 00:29:20,446 pour les utiliser en ligne. 494 00:29:20,785 --> 00:29:22,544 Enrichissement Wikidata en metadonnées PM20. 495 00:29:22,544 --> 00:29:24,073 Voilà donc ce que nous obtenons. 496 00:29:24,073 --> 00:29:25,886 Il ne s'agit pas uniquement de données simples 497 00:29:25,886 --> 00:29:27,955 comme les dates de naissance, mais... 498 00:29:27,955 --> 00:29:29,835 oups, pardonnez-moi... 499 00:29:29,835 --> 00:29:34,998 mais aussi de déclarations complexes 500 00:29:34,998 --> 00:29:39,787 sur des éléments déjà existants, 501 00:29:39,787 --> 00:29:42,700 comme par exemple, si cette personne est un superviseur 502 00:29:42,700 --> 00:29:45,790 membre du conseil d'administration de ladite société 503 00:29:46,682 --> 00:29:48,905 durant cette période, 504 00:29:49,663 --> 00:29:54,196 et est référencé dans... 505 00:29:54,409 --> 00:29:56,149 (hésitation) 506 00:29:56,149 --> 00:30:01,864 utilisé dans un contexte scientifique. 507 00:30:04,926 --> 00:30:06,488 Première étape du don de données ZBW : 508 00:30:06,488 --> 00:30:07,763 L'archive personnelle - achevé 509 00:30:07,763 --> 00:30:10,939 La première étape de ce don de données a été achevée. 510 00:30:12,736 --> 00:30:17,201 Les archives personnelles sont entièrement reliées à Wikidata. 511 00:30:18,333 --> 00:30:23,652 C'est aussi devenu un outil d'informations. 512 00:30:23,652 --> 00:30:27,360 Beaucoup d'éléments qui ont déjà été... 513 00:30:27,360 --> 00:30:30,422 n'avaient pas de références externes. 514 00:30:31,278 --> 00:30:35,674 Et nous avons généré un peu plus de 6 000 déclarations, 515 00:30:36,201 --> 00:30:41,924 maintenant sourcées dans les métadonnées de cette archive. 516 00:30:43,737 --> 00:30:45,288 Le prochain grand défi. 517 00:30:45,288 --> 00:30:49,951 Eh bien, c'était la partie la plus facile, 518 00:30:50,880 --> 00:30:54,785 parce que les personnes sont facilement identifiables dans Wikidata. 519 00:30:56,494 --> 00:31:00,443 Plus de 90 % d'entre-elles y existaient déjà, 520 00:31:00,443 --> 00:31:02,412 donc nous pouvions relier les informations. 521 00:31:02,412 --> 00:31:06,486 Nous avons créé une centaine d'articles pour ces derniers, 522 00:31:06,486 --> 00:31:08,807 et pour ceux qui manquaient. 523 00:31:09,296 --> 00:31:10,996 Mais à présent, 524 00:31:12,666 --> 00:31:18,165 nous travaillons sur le reste des archives, 525 00:31:18,165 --> 00:31:20,432 notamment sur les sujets des archives, 526 00:31:21,243 --> 00:31:24,787 ce qui signifie cartographier un système historique 527 00:31:24,787 --> 00:31:29,884 pour l'organisation du savoir sur le monde entier, 528 00:31:29,884 --> 00:31:34,147 matérialisée sous forme de coupures de presse sur Wikidata. 529 00:31:36,305 --> 00:31:41,898 Pour vous expliquer simplement, les archives de pays et de sujets 530 00:31:42,668 --> 00:31:48,773 sont organisées selon une hiérarchie de pays 531 00:31:48,773 --> 00:31:50,882 et d'autres entités géographiques, 532 00:31:52,499 --> 00:31:56,443 et sont traduites en anglais, ce qui rend les choses plus faciles. 533 00:31:56,443 --> 00:32:01,861 Et la langue allemande s'est profondément imbriquée... 534 00:32:03,881 --> 00:32:08,064 profondément imbriquée dans la classification des sujets 535 00:32:08,064 --> 00:32:11,593 Et cette combinaison définit un... 536 00:32:13,032 --> 00:32:15,906 un (s'exprime en allemand) 537 00:32:16,289 --> 00:32:21,128 Donc, nous souhaitons à présent les faire correspondre 538 00:32:21,128 --> 00:32:24,575 à une structure de Wikidata, et d'intégrer les données. 539 00:32:25,972 --> 00:32:26,972 Merci ! 540 00:32:26,972 --> 00:32:29,338 Et je veux vous inviter 541 00:32:29,338 --> 00:32:33,801 à participer à ce beau défi 542 00:32:33,801 --> 00:32:36,272 en termes d'organisation des savoirs. 543 00:32:37,739 --> 00:32:40,713 Il s'agit donc d'un projet Wiki dont la progression est suivie, 544 00:32:40,713 --> 00:32:46,288 et vous pouvez le suivre ou y participer. 545 00:32:46,591 --> 00:32:48,908 Voilà, merci beaucoup. 546 00:32:49,639 --> 00:32:51,723 (applaudissements) 547 00:33:03,999 --> 00:33:07,284 Amenons donc maintenant les arts du spectacle dans Wikidata, 548 00:33:07,735 --> 00:33:11,930 et donc dans le cloud lié, 549 00:33:11,930 --> 00:33:15,595 en créant un écosystème de données ouvertes liées pour les arts de la scène. 550 00:33:16,164 --> 00:33:21,068 Et la question à laquelle j'essaie de répondre, 551 00:33:21,068 --> 00:33:24,463 et j'espère que vous m'y aiderez, 552 00:33:24,463 --> 00:33:27,012 est : « Quelle place donne-t-on à Wikidata, et cetera ? » 553 00:33:27,012 --> 00:33:33,886 Mais permettez-moi de partager d'abord mes expériences de cette année, 554 00:33:34,503 --> 00:33:36,154 durant le premier semestre de l'année, 555 00:33:36,154 --> 00:33:39,350 quand j'ai eu le plaisir de travailler avec la CAPACOA, 556 00:33:39,350 --> 00:33:42,074 qui est l'Association canadienne des organismes artistiques, 557 00:33:42,074 --> 00:33:47,408 à l'initiative d'un projet appelé « Un avenir numérique lié ». 558 00:33:47,831 --> 00:33:51,221 Pour que l'ensemble des arts de la scène canadiens 559 00:33:51,221 --> 00:33:53,441 adoptent les données ouvertes liées. 560 00:33:53,441 --> 00:33:56,887 Ils ont lancé cette initiative en partant de l'observation 561 00:33:56,887 --> 00:33:59,042 qu'au cours des cinq dernières années, 562 00:33:59,731 --> 00:34:03,924 la problématique principale des arts du spectacle 563 00:34:03,924 --> 00:34:08,855 était que les métadonnées n'étaient pas disponibles en qualité suffisante 564 00:34:08,855 --> 00:34:11,780 ni interconnectées, ni même interopérables. 565 00:34:12,106 --> 00:34:16,498 C'est pourquoi certaines représentations, 566 00:34:16,498 --> 00:34:19,542 ou événements, ne sont pas si simples à indexer 567 00:34:19,542 --> 00:34:24,777 par Google et des assistants numériques, et cetera. 568 00:34:25,989 --> 00:34:29,757 Ainsi, la vision que nous avons eue ensemble, 569 00:34:29,757 --> 00:34:32,997 était de disposer d'une base de connaissances 570 00:34:34,013 --> 00:34:35,646 pour de nombreux acteurs simultanément. 571 00:34:35,646 --> 00:34:39,636 Nous avons donc examiné l'ensemble du réseau de valeurs des arts de la scène, 572 00:34:39,636 --> 00:34:42,073 nous y avons identifié les principaux acteurs, 573 00:34:42,073 --> 00:34:44,255 nous avons passé en revue les scénarios d'utilisation 574 00:34:44,255 --> 00:34:46,632 que nous souhaitions implémenter, 575 00:34:47,719 --> 00:34:52,074 et l'avons en quelque sorte cartographié à l'ensemble de l'architecture 576 00:34:52,074 --> 00:34:54,447 d'une telle base de connaissances, 577 00:34:54,447 --> 00:34:57,097 ou des différentes plateformes qui s'y trouvent, 578 00:34:57,097 --> 00:34:59,535 ce qui est, évidemment, une architecture distribuée, 579 00:34:59,535 --> 00:35:01,361 et pas un seul grand monolithe. 580 00:35:02,499 --> 00:35:07,504 Je vais simplement survoler cette partie car nous disposons de dix minutes chacun, 581 00:35:09,035 --> 00:35:13,796 mais je pense que nous aurons du temps pour approfondir cela ce soir ou demain, 582 00:35:13,796 --> 00:35:16,318 si des personnes veulent en savoir un peu plus. 583 00:35:16,318 --> 00:35:19,116 Nous sommes donc partis de ce réseau de valeurs des arts de la scène 584 00:35:19,116 --> 00:35:23,263 ce qui, curieusement, a été publié l'année dernière, 585 00:35:23,263 --> 00:35:27,691 nous avons donc eu la chance de pouvoir nous appuyer sur des travaux antérieurs, 586 00:35:27,691 --> 00:35:31,098 par exemple, on a la chaîne de valeur primaire des arts du spectacle au milieu, 587 00:35:31,098 --> 00:35:34,177 et les différents acteurs autour. 588 00:35:34,177 --> 00:35:37,387 Au total, nous avons identifié 20 groupes d'acteurs, 589 00:35:37,387 --> 00:35:43,384 que nous pouvons ensuite rassembler en sept grandes catégories. 590 00:35:43,395 --> 00:35:45,464 Pour chacun des groupes d'acteurs, 591 00:35:45,464 --> 00:35:51,558 nous avons en quelque sorte formulé le type de besoins 592 00:35:51,558 --> 00:35:54,718 qu'ils auraient d'une telle infrastructure, 593 00:35:54,718 --> 00:35:58,572 ce qu'ils seraient en mesure de réaliser si le tout était interconnecté 594 00:35:58,572 --> 00:36:02,062 et que les données étaient accessibles au public. 595 00:36:02,637 --> 00:36:04,990 On peut donc voir ici les types... 596 00:36:04,990 --> 00:36:09,177 les différents types : *Production*, *Présentation et promotion*, 597 00:36:09,177 --> 00:36:13,852 *Couverture et réutilisation*, *le Live*, *Consommation en ligne*, *Héritage*, 598 00:36:13,852 --> 00:36:15,959 *Recherche et éducation*. 599 00:36:15,959 --> 00:36:21,275 Et après avoir rassemblé cela en un tout, dont on peut voir la première partie ici, 600 00:36:21,275 --> 00:36:23,878 nous avons pu, disons, comparer, examiner 601 00:36:23,878 --> 00:36:26,954 quel type de données ont été utilisées dans l'ensemble du tableau, 602 00:36:26,954 --> 00:36:31,248 par les différents groupes d'acteurs. 603 00:36:31,248 --> 00:36:36,863 Et la base de données qui leur est commune est plutôt importante 604 00:36:36,863 --> 00:36:43,063 et c'est bien là que ça a du sens d'incorporer et de garder... 605 00:36:43,063 --> 00:36:45,988 de conserver ces données ensemble. 606 00:36:47,602 --> 00:36:50,651 Donc, lorsque l'on parle de l'architecture de la plateforme, 607 00:36:50,651 --> 00:36:53,648 on peut voir que nous avons quatre couches ici. 608 00:36:54,096 --> 00:36:56,448 En bas, apparaît la couche de données, 609 00:36:56,448 --> 00:36:58,717 bien évidemment, Wikidata y joue un rôle, 610 00:36:58,717 --> 00:37:02,733 mais aussi de nombreuses autres bases de données distribuées 611 00:37:02,733 --> 00:37:07,769 qui peuvent publier des données via des points de terminaison SPARQL. 612 00:37:09,204 --> 00:37:13,106 Le nuage jaune au milieu est la couche sémantique, 613 00:37:13,106 --> 00:37:16,080 c'est notre langue commune pour décrire les choses, 614 00:37:16,080 --> 00:37:18,620 pour créer des déclarations 615 00:37:18,620 --> 00:37:22,400 autour des arts de la scène, de l'ontologie. 616 00:37:22,400 --> 00:37:25,243 Nous avons ensuite une couche d'application 617 00:37:25,243 --> 00:37:30,551 qui se compose de différents modules, par exemple, l'analyse des données, 618 00:37:30,551 --> 00:37:31,843 l'extraction de données, 619 00:37:31,843 --> 00:37:36,029 comment transformer des données non structurées en données structurées, 620 00:37:36,029 --> 00:37:38,749 comment assister cette tâche par des outils. 621 00:37:39,436 --> 00:37:42,478 Puis, évidemment, il y a la visualisation des données, 622 00:37:42,478 --> 00:37:44,961 par exemple, s'il existe de grandes quantités de données, 623 00:37:44,961 --> 00:37:47,801 vous voudrez les visualiser d'une manière ou d'une autre. 624 00:37:47,801 --> 00:37:50,155 Et au sommet, vous avez la couche de présentation, 625 00:37:50,155 --> 00:37:56,199 c'est ce avec quoi les gens ordinaires interagissent quotidiennement : 626 00:37:56,199 --> 00:37:59,615 les moteurs de recherche, les encyclopédies, les agendas culturels, 627 00:37:59,615 --> 00:38:02,097 et tout un tas d'autres services. 628 00:38:03,395 --> 00:38:05,386 Nous ne partons pas de zéro. 629 00:38:05,386 --> 00:38:08,535 Certains travaux ont déjà été menés dans ce domaine. 630 00:38:09,107 --> 00:38:13,043 Je me contenterai de citer quelques exemples de projets 631 00:38:13,043 --> 00:38:15,245 auxquels j'ai participé, 632 00:38:15,245 --> 00:38:18,149 ainsi que d'autres sujets. 633 00:38:18,149 --> 00:38:21,195 J'ai donc débuté dans ce domaine 634 00:38:21,195 --> 00:38:24,476 avec les Archives suisses des arts du spectacle. 635 00:38:24,751 --> 00:38:27,795 En plus de la construction d'une base de données sur les arts de la scène, 636 00:38:27,795 --> 00:38:31,046 nous en avons créé l'ontologie, 637 00:38:31,046 --> 00:38:33,931 qui est actuellement implémentée en RDF, 638 00:38:34,701 --> 00:38:37,681 et on dispose déjà d'une base de données 639 00:38:37,681 --> 00:38:43,053 regroupant 60 à 70 ans d'histoire du spectacle Suisse, 640 00:38:43,053 --> 00:38:45,145 c'est donc quelque chose qui peut servir de base, 641 00:38:45,145 --> 00:38:48,999 et ça a été transformé en RDF. 642 00:38:49,968 --> 00:38:54,621 Et il y existe déjà une plateforme où ces données peuvent être consultées. 643 00:38:56,073 --> 00:39:01,498 Alors nous avons fait plusieurs injections dans Wikidata, 644 00:39:01,498 --> 00:39:02,877 en partie de la Suisse, 645 00:39:02,877 --> 00:39:08,990 mais aussi des instituts des arts du spectacle. 646 00:39:09,680 --> 00:39:12,357 Bart Magnus a par exemple participé à ce projet. 647 00:39:12,883 --> 00:39:15,078 Il en a été le moteur. 648 00:39:15,078 --> 00:39:17,223 Il y existe aussi des éléments de Wikimedia Commons, 649 00:39:17,223 --> 00:39:21,361 mais qui ne sont pas très bien reliés au reste de nos métadonnées, 650 00:39:21,361 --> 00:39:25,097 et évidemment, en procédant à cette injection, 651 00:39:25,097 --> 00:39:31,222 nous avons pu aussi implémenter une partie de ce modèle dans Wikidata. 652 00:39:32,767 --> 00:39:39,013 L'un de nos partenaires Canadien est Culture Creates. 653 00:39:39,013 --> 00:39:43,872 Ils gèrent une plateforme qui récupère les données des sites web des théâtres 654 00:39:43,872 --> 00:39:46,873 et les injectent dans un graphique de connaissances, 655 00:39:48,293 --> 00:39:51,698 pour ensuite l'exposer aux moteurs de recherche 656 00:39:51,698 --> 00:39:55,438 et d'autres dispositifs de recherche. 657 00:39:56,415 --> 00:39:58,811 Et là encore, 658 00:39:58,811 --> 00:40:03,261 nous avons en quelque sorte implémenté et étendu ce système à l'ontologie. 659 00:40:03,261 --> 00:40:05,389 Et comme on peut le voir sur la diapositive, 660 00:40:05,389 --> 00:40:09,599 il y a encore beaucoup d'espaces vides, mais il y a aussi des chevauchements, 661 00:40:09,599 --> 00:40:13,456 et un chevauchement important qui est évidemment la langue commune partagée, 662 00:40:13,456 --> 00:40:18,693 ce qui nous aidera à interconnecter les différents ensembles de données. 663 00:40:20,759 --> 00:40:22,587 Il est également important 664 00:40:22,587 --> 00:40:26,404 d'utiliser les même registres de base et fichiers d'autorité, 665 00:40:26,406 --> 00:40:31,368 et Wikidata joue un rôle important dans ce domaine 666 00:40:31,368 --> 00:40:33,967 en interconnectant. 667 00:40:34,619 --> 00:40:37,799 J'aimerais maintenant vous faire part des recommandations 668 00:40:37,799 --> 00:40:41,882 par le comité consultatif de l'initiative « Un avenir numérique lié », 669 00:40:42,769 --> 00:40:45,169 tout du moins, des deux premières recommandations. 670 00:40:45,169 --> 00:40:49,450 Donc, pour les Canadiens, il est désormais crucial de remplir 671 00:40:49,450 --> 00:40:53,173 leur propre graphique des connaissances sur les arts du spectacle, 672 00:40:53,173 --> 00:40:55,851 car, contrairement aux Archives suisses des arts du spectacle, 673 00:40:55,851 --> 00:40:59,389 ils n'ont pas une base de données déjà existante, 674 00:40:59,389 --> 00:41:01,906 mais ils peuvent la créer, 675 00:41:01,906 --> 00:41:04,468 et il est absolument crucial d'y avoir des données. 676 00:41:04,468 --> 00:41:06,934 Et deuxièmement, comme vous pouvez le voir, 677 00:41:06,934 --> 00:41:09,024 cela concerne Wikidata. 678 00:41:09,024 --> 00:41:12,342 Wikidata, aux yeux du comité consultatif, 679 00:41:12,342 --> 00:41:16,718 a été considéré comme source complémentaire à *Artsdata.ca*, 680 00:41:16,718 --> 00:41:18,347 ce graphique de connaissance, 681 00:41:18,347 --> 00:41:20,794 et, par conséquent, des efforts devraient être faits 682 00:41:20,794 --> 00:41:22,703 pour contribuer à sa population 683 00:41:22,703 --> 00:41:25,813 par le biais de données relatives aux arts du spectacle. 684 00:41:25,813 --> 00:41:30,775 Et c'est à ces fins que nous allons œuvrer au cours des mois et des années à venir, 685 00:41:30,775 --> 00:41:34,748 et c'est aussi pourquoi je suis un peu à l'affût 686 00:41:34,748 --> 00:41:38,454 de voir qui d'autre se joindra à cet effort. 687 00:41:38,454 --> 00:41:40,556 Wikidata et le WD classique sont complémentaires. 688 00:41:40,556 --> 00:41:44,942 Donc, évidemment, actuellement, nous les disons complémentaires. 689 00:41:44,942 --> 00:41:46,631 Nous devons donc réfléchir 690 00:41:46,631 --> 00:41:49,844 aux avantages et inconvénients de chacune des approches, 691 00:41:49,844 --> 00:41:52,073 et on peut voir ici une comparaison 692 00:41:52,073 --> 00:41:56,120 entre les approches Wikidata et les données ouvertes liées classiques. 693 00:41:56,887 --> 00:41:59,947 Je serais heureux d'approfondir le sujet avec vous, 694 00:41:59,947 --> 00:42:02,549 quelles expériences vous avez de cela, 695 00:42:02,814 --> 00:42:05,767 mais mon point de vue est que Wikidata est un atout considérable, 696 00:42:05,767 --> 00:42:07,727 parce que c'est une plateforme de crowdsourcing, 697 00:42:07,727 --> 00:42:11,671 et qu'il est facile d'inviter d'autres acteurs à y contribuer. 698 00:42:11,683 --> 00:42:17,482 Le point négatif, évidemment, est la perte de contrôle : 699 00:42:17,658 --> 00:42:20,424 les propriétaires de données doivent abandonner le contrôle 700 00:42:20,424 --> 00:42:22,162 de leurs graphiques, 701 00:42:22,162 --> 00:42:26,554 de la qualité et l'exhaustivité des données. 702 00:42:26,554 --> 00:42:29,353 Il est plus difficile d'effectuer un suivi sur Wikidata 703 00:42:29,353 --> 00:42:31,493 que si vous en aviez le contrôle. 704 00:42:31,493 --> 00:42:36,236 Une autre force de Wikidata est que ça exige 705 00:42:36,236 --> 00:42:39,617 une intégration immédiate dans ce graphique mondial, 706 00:42:39,617 --> 00:42:41,734 et vous pouvez le faire... 707 00:42:42,544 --> 00:42:46,768 pas à pas par rapport à d'autres bases de données, 708 00:42:46,768 --> 00:42:49,528 ce qui peut également être vu par certains comme un avantage, 709 00:42:49,528 --> 00:42:53,914 mais bien sûr, si vous cherchez de l'intégration et de l'interopérabilité, 710 00:42:53,914 --> 00:42:56,792 Wikidata vous oblige à aller le chercher depuis le début. 711 00:42:59,184 --> 00:43:03,157 Et puis, évidemment, l'harmonisation des pratiques de modélisation des données 712 00:43:03,157 --> 00:43:05,552 pose problème dans les deux options. 713 00:43:06,039 --> 00:43:08,611 Mais cela peut vous sembler plus facile, au début, 714 00:43:08,611 --> 00:43:10,671 de le faire dans votre propre silo, 715 00:43:10,671 --> 00:43:13,356 parce qu'à un moment donné, vous en aurez terminé avec cette tâche, 716 00:43:13,356 --> 00:43:16,693 sinon ça resterait une tâche en cours sur Wikidata. 717 00:43:18,280 --> 00:43:22,883 Ainsi, lorsqu'il s'agit de définir les données à injecter en priorité, 718 00:43:23,535 --> 00:43:28,395 voici les règles, que je vais passer en revue. 719 00:43:30,055 --> 00:43:32,325 Tout d'abord, on injectera les données 720 00:43:32,325 --> 00:43:36,191 là où l'autorité naturelle n'est pas clairement définie, 721 00:43:36,191 --> 00:43:40,433 il s'agit donc évidemment de données qui seront gérées de manière partagée. 722 00:43:40,902 --> 00:43:43,941 On injectera des données 723 00:43:43,941 --> 00:43:47,149 là où nous voyons un potentiel élevé de crowdsourcing. 724 00:43:47,149 --> 00:43:49,133 On injectera des données 725 00:43:49,133 --> 00:43:51,693 là où elles sont susceptibles d'être réutilisées 726 00:43:51,693 --> 00:43:53,965 dans le contexte de Wikipédia. 727 00:43:54,813 --> 00:44:00,262 Et il y a aussi un espoir qu'une partie de la coordination internationale 728 00:44:00,262 --> 00:44:03,064 autour de l'ensemble de la modélisation des données, 729 00:44:03,064 --> 00:44:04,364 autour de la normalisation, 730 00:44:04,364 --> 00:44:07,531 puisse avoir avoir lieu directement sur Wikidata, 731 00:44:07,531 --> 00:44:09,484 si ce n'est ailleurs, 732 00:44:09,484 --> 00:44:12,309 parce que cela force les gens à interagir 733 00:44:12,309 --> 00:44:14,816 s'ils injectent leurs données dans un même endroit. 734 00:44:15,963 --> 00:44:19,490 Et j'aimerais maintenant aborder 735 00:44:19,490 --> 00:44:22,181 les registres de base et les fichiers d'autorité 736 00:44:22,181 --> 00:44:25,785 car ils nous aident en quelque sorte à créer des liens 737 00:44:25,785 --> 00:44:29,010 entre les différentes données et des vocabulaires contrôlés 738 00:44:29,010 --> 00:44:32,833 comme une extension de l'ontologie existante. 739 00:44:33,965 --> 00:44:35,994 Il nous reste donc à voir deux autres diapositives. 740 00:44:36,480 --> 00:44:40,978 La prochaine étape consiste à passer de la « somme des GLAM » 741 00:44:40,978 --> 00:44:42,888 et à « Wiki aime les arts du spectacle ». 742 00:44:42,888 --> 00:44:47,524 Cela signifie que nous décrivons les lieux et organismes 743 00:44:47,524 --> 00:44:51,106 et essayons d'envoyer ces données dans Wikipedia 744 00:44:51,106 --> 00:44:54,414 sous forme d'infoboxes et infobulles. 745 00:44:54,414 --> 00:44:59,769 L'autre projet que je vais mener est le COST Action, 746 00:45:00,336 --> 00:45:02,001 que nous présenterons l'année prochaine 747 00:45:02,930 --> 00:45:06,037 autour de cet écosystème de données ouvertes liées pour les arts du spectacle. 748 00:45:06,037 --> 00:45:07,927 COST est un programme européen 749 00:45:07,927 --> 00:45:10,347 qui soutient les activités de mise en réseau, 750 00:45:10,347 --> 00:45:13,929 et les sujets à traiter sont énumérés ici. 751 00:45:13,929 --> 00:45:16,404 J'en ai souligné deux d'entre eux : 752 00:45:16,404 --> 00:45:20,702 l'un d'entre eux traite de la question de fédération entre Wikidata 753 00:45:20,702 --> 00:45:23,717 et une approche de données ouvertes liées. 754 00:45:24,368 --> 00:45:27,744 Et l'autre est également très important à mon sens, 755 00:45:27,744 --> 00:45:30,528 et présente un énorme potentiel, 756 00:45:30,528 --> 00:45:33,133 il s'agit de mettre en œuvre des campagnes internationales 757 00:45:33,133 --> 00:45:35,993 pour suppléer les données sur Wikidata. 758 00:45:37,627 --> 00:45:38,975 Eh bien, voilà ! 759 00:45:38,975 --> 00:45:41,365 Je vous remercie de votre attention. 760 00:45:41,365 --> 00:45:45,762 Maintenant, je vais demander à mes collègues de me rejoindre. 761 00:45:47,086 --> 00:45:50,529 Pour le panel, nous aurons peut-être des microphones également. 762 00:45:53,903 --> 00:45:55,682 Et puis j'aimerais... 763 00:45:57,473 --> 00:45:59,940 vous donner la possibilité de poser des questions, 764 00:46:01,042 --> 00:46:05,185 et bien sûr demander à mes collègues 765 00:46:05,753 --> 00:46:08,071 s'ils ont des questions les uns pour les autres. 766 00:46:12,049 --> 00:46:15,327 Alors, avons-nous une question du public ? 767 00:46:18,114 --> 00:46:19,974 (rires) 768 00:46:20,502 --> 00:46:22,587 (un·e intervenant·e parle sans micro) 769 00:46:22,587 --> 00:46:23,587 (rires) 770 00:46:23,587 --> 00:46:27,033 (intervenant·e 2) J'aimerais demander à chacun d'entre vous 771 00:46:27,033 --> 00:46:30,842 où vous traceriez la ligne... 772 00:46:30,842 --> 00:46:33,076 en gros, comment vous définiriez 773 00:46:33,076 --> 00:46:35,956 le moment où il est nécessaire de gérer votre propre Wikibase, 774 00:46:35,956 --> 00:46:39,328 et ce vous mettriez sur Wikidata ? 775 00:46:39,328 --> 00:46:45,257 Est-ce qu'il y a une délimitation claire derrière la mise en ordre ? 776 00:46:48,211 --> 00:46:51,484 Je peux répondre en premier parce que j'ai le micro. 777 00:46:51,484 --> 00:46:56,955 Donc, je pense que l'un des enjeux est la notoriété. 778 00:46:59,212 --> 00:47:02,084 J'y réponds dans un autre projet. 779 00:47:02,084 --> 00:47:05,898 Et je pense que la licence pourrait en être un aussi, 780 00:47:05,898 --> 00:47:08,580 parce que vous pouvez imposer vos propres conditions 781 00:47:08,580 --> 00:47:13,782 dans votre propre base de données, lorsque c'est possible. 782 00:47:14,284 --> 00:47:19,882 Et troisièmement, je dirais qu'il faut avoir un bac à sable, 783 00:47:19,882 --> 00:47:23,078 pour préparer l'injection des données dans Wikidata. 784 00:47:23,078 --> 00:47:26,085 Voici les trois idées qui me viennent pour l'instant, 785 00:47:26,085 --> 00:47:28,554 mais je peux en trouver d'autres. 786 00:47:29,976 --> 00:47:32,369 Pour moi, les droits seront toujours un problème. 787 00:47:32,369 --> 00:47:36,686 Donc, si la Bibliothèque nationale voulait se diriger vers une Wikibase, 788 00:47:36,686 --> 00:47:39,740 cela leur permettrait de continuer à contrôler l'octroi des licences 789 00:47:39,740 --> 00:47:42,539 pour le travail qu'ils ont accompli sur les termes en langue maori. 790 00:47:43,438 --> 00:47:46,483 La base de données kakapo ne contient que des données 791 00:47:46,483 --> 00:47:49,977 que le Ministère de la conservation a estimé pouvoir rendre publique, 792 00:47:49,977 --> 00:47:52,739 mais s'ils le voyaient en état de marche, 793 00:47:52,739 --> 00:47:55,980 ils pourraient être tentés d'utiliser une Wikibase privée 794 00:47:55,980 --> 00:47:58,128 pour gérer leur propre base de données, 795 00:47:58,128 --> 00:48:00,884 tout bonnement à cause de certains des outils de visualisation 796 00:48:00,884 --> 00:48:03,567 qui pourraient être appliqués et seraient bien plus efficaces 797 00:48:03,567 --> 00:48:07,417 qu'un système de tableur Excel qu'ils utilisent actuellement. 798 00:48:12,337 --> 00:48:16,556 Eh bien, je pense que cela dépend beaucoup du type de données. 799 00:48:17,609 --> 00:48:22,359 Avec les archives de presse, nous avons été assez chanceux, 800 00:48:22,359 --> 00:48:26,984 en ce sens qu'il s'agissait d'un support qui a été publié... 801 00:48:26,984 --> 00:48:29,829 qui a été publié à l'époque, 802 00:48:30,153 --> 00:48:31,780 mais sa publication a été coûteuse. 803 00:48:33,082 --> 00:48:36,234 Donc, c'est assez simple. 804 00:48:36,234 --> 00:48:39,449 Je pense aussi que les projets... 805 00:48:40,101 --> 00:48:42,476 et c'était un projet classique : 806 00:48:42,476 --> 00:48:45,726 il a été financé pendant un temps donné, puis le financement a pris fin, 807 00:48:46,466 --> 00:48:51,516 et puis les données ont été enfermées dans un silo, 808 00:48:52,136 --> 00:48:55,106 au sein de certains logiciels qui ne sont pas éternels. 809 00:48:55,846 --> 00:48:59,436 Et donc, cela fait absolument sens à mes yeux. 810 00:48:59,896 --> 00:49:02,776 À l'époque, Wikidata n'existait pas, mais maintenant il est là, 811 00:49:03,376 --> 00:49:06,066 et c'est tout à fait logique pour notre projet 812 00:49:06,066 --> 00:49:09,324 d'en discuter la viabilité 813 00:49:09,324 --> 00:49:14,763 dans un contexte où la question est l'intégration à un écosystème plus vaste 814 00:49:15,227 --> 00:49:17,137 comme Wikidata, 815 00:49:17,137 --> 00:49:18,878 et ce que c'est exactement, 816 00:49:18,878 --> 00:49:21,408 en discuter avec la communauté Wikidata, 817 00:49:21,408 --> 00:49:26,864 quel en est l'aspect notable et quel sens ça a de l'ajouter à Wikidata, 818 00:49:26,864 --> 00:49:32,093 et quel sens ça a de le conserver sous forme de propriété, 819 00:49:32,093 --> 00:49:37,753 peut-être sous une forme plus simple qu'une application sophistiquée, 820 00:49:37,753 --> 00:49:43,055 mais de le rendre accessible et le relier au cloud de big data 821 00:49:43,055 --> 00:49:46,032 au lieu d'investir beaucoup d'argent 822 00:49:46,032 --> 00:49:52,692 dans un silo qui ne tiendra pas. 823 00:49:55,201 --> 00:50:00,121 Comme je l'ai déjà dit dans le projet que j'ai présenté ici, 824 00:50:00,121 --> 00:50:04,926 comme les dualités entre Wikidata et les données ouvertes liées classiques, 825 00:50:04,926 --> 00:50:07,928 il ne s'agit donc pas tant de la mise en place d'une Wikibase privée. 826 00:50:11,147 --> 00:50:14,504 Nous avons également fait face à un défi, dans Wikidata : 827 00:50:14,504 --> 00:50:19,760 lorsqu'on injecte ses propres données, on doit également faire un peu de ménage, 828 00:50:20,744 --> 00:50:23,509 et nettoyer ce qu'ont fait les autres, en réalité. 829 00:50:24,043 --> 00:50:25,968 Ça peut en décourager certains, 830 00:50:25,968 --> 00:50:29,888 ou bien ça veut dire qu'on va devoir s'en occuper pas à pas. 831 00:50:30,375 --> 00:50:33,466 Il y aura donc, dans un premier temps, une base de données vivant 832 00:50:33,873 --> 00:50:35,581 dans un Web de données classique 833 00:50:35,581 --> 00:50:38,395 qu'on commencera à relier à Wikidata, 834 00:50:38,395 --> 00:50:42,985 et il s'agit d'un processus continu pour déterminer pour quels domaines 835 00:50:42,985 --> 00:50:47,643 les données de références vivront finalement sur Wikidata, 836 00:50:48,168 --> 00:50:51,946 et pour quels domaines elles vivront sur d'autres bases de données. 837 00:50:52,620 --> 00:50:54,865 Il est évident que nous aurons des défis à relever 838 00:50:54,865 --> 00:50:57,135 concernant la synchronisation, 839 00:50:57,135 --> 00:51:01,507 comme nous l'avons probablement tous au travers de ce champ de Web de données. 840 00:51:01,507 --> 00:51:04,826 où il nous faut encore négocier à qui l'on peut se fier, 841 00:51:05,160 --> 00:51:08,720 qui possède les droits, sur quoi. 842 00:51:13,830 --> 00:51:15,820 (assistant·e) D'autres questions ? 843 00:51:23,981 --> 00:51:25,550 (intervenant·e 3) Merci. 844 00:51:26,090 --> 00:51:31,030 Alors, je suis tout à fait d'accord avec cette question de... 845 00:51:32,395 --> 00:51:36,909 déterminer où placer la limite 846 00:51:36,909 --> 00:51:41,607 entre les raisons pour lesquelles nous mettons des données sur Wikidata, 847 00:51:43,044 --> 00:51:49,144 ou pourquoi on les garde, on les crée, les gére et les met à jour 848 00:51:49,144 --> 00:51:53,444 dans les bases de données locales et à quelles fins. 849 00:51:53,778 --> 00:51:57,213 Et je pense qu'il s'agit d'un grand débat 850 00:51:57,213 --> 00:52:02,383 qui va au-delà du simple enthousiasme 851 00:52:02,383 --> 00:52:07,423 de mettre des données sur Wikidata parce que c'est public, 852 00:52:07,432 --> 00:52:10,762 parce qu'il sert l'humanité, parce que... 853 00:52:11,031 --> 00:52:13,362 ou qu'il possède des outils sympas, 854 00:52:13,362 --> 00:52:18,132 et les choses sont plus compliquées dans la vie réelle, je pense. 855 00:52:19,162 --> 00:52:24,102 Eh bien, malgré cela, c'est un débat assez intéressant. 856 00:52:24,435 --> 00:52:29,744 Et il y a un autre problème qui est débattu 857 00:52:29,744 --> 00:52:35,034 dans cet événement où l'on présente différents panels : 858 00:52:35,775 --> 00:52:41,129 d'un côté, vous avez votre propre base de données, 859 00:52:41,129 --> 00:52:43,194 quelle que soit la technologie, 860 00:52:43,194 --> 00:52:46,763 et vous publiez des choses sur Wikidata, 861 00:52:47,233 --> 00:52:51,166 ou vous construisez votre propre système 862 00:52:51,166 --> 00:52:55,246 en termes de création et de gestion de l'information 863 00:52:55,246 --> 00:52:58,131 à partir de la technologie Wikibase. 864 00:52:58,591 --> 00:53:02,201 Et ensuite, vous synchronisez ou je ne sais quoi... 865 00:53:02,201 --> 00:53:04,281 fédérez ou bien autre chose ; 866 00:53:04,281 --> 00:53:08,314 il s'agit toujours d'une question de technologie utilisée, 867 00:53:09,182 --> 00:53:14,796 et le fait que vous utilisiez Wikidata juste pour la publication, 868 00:53:14,978 --> 00:53:18,637 ou l'infrastructure qui se trouve sous Wikidata 869 00:53:18,637 --> 00:53:23,002 pour créer et gérer vos données. 870 00:53:23,002 --> 00:53:24,092 Donc... 871 00:53:24,804 --> 00:53:26,104 (hésitation) 872 00:53:27,116 --> 00:53:30,914 Je veux dire que nous avons eu une discussion 873 00:53:30,914 --> 00:53:34,254 sur le panel de la Wikibase, 874 00:53:34,254 --> 00:53:36,912 et il y aura d'autres débats ici, 875 00:53:36,912 --> 00:53:40,815 mais je pense qu'il y a différents niveaux. 876 00:53:41,626 --> 00:53:47,756 Vous réagissez certainement à ce débat sur Wikibase ou Wikidata... 877 00:53:48,930 --> 00:53:52,427 Je pense que c'est problématique de tant nous concentrer 878 00:53:52,427 --> 00:53:54,429 sur cette infrastructure Wikibase, 879 00:53:54,429 --> 00:53:56,158 parce qu'il existe d'autres infrastructures, 880 00:53:56,158 --> 00:53:58,690 comme dans le domaine des arts du spectacle. 881 00:53:59,810 --> 00:54:02,274 Nous avons une communauté complémentaire supplémentaire 882 00:54:02,274 --> 00:54:04,054 qui est MusicBrainz, 883 00:54:04,054 --> 00:54:08,954 qui tourne sur sa propre plateforme, qui fournit des données ouvertes liées 884 00:54:09,614 --> 00:54:12,692 et tel que je le comprends, 885 00:54:14,160 --> 00:54:17,232 il existe un accord au sein de la communauté Wikidata 886 00:54:17,232 --> 00:54:19,731 qui dit que nous n'allons pas doubler toutes les données... 887 00:54:19,731 --> 00:54:21,489 nous n'allons pas copier toutes les données, 888 00:54:21,489 --> 00:54:24,848 mais nous acceptons qu'ils soient complémentaires. 889 00:54:24,848 --> 00:54:26,166 Alors, que se passera-t-il 890 00:54:26,166 --> 00:54:30,246 lorsqu'on commencera à intégrer ces données dans Wikipédia ? 891 00:54:30,246 --> 00:54:31,907 les infoboxes, par exemple. 892 00:54:31,907 --> 00:54:34,064 Serons-nous en mesure d'extraire ces données 893 00:54:34,064 --> 00:54:36,764 directement à partir de leur points de terminaison SPARQL ? 894 00:54:36,764 --> 00:54:39,603 Ou serons-nous obligés de copier toutes les données, 895 00:54:39,603 --> 00:54:42,225 et quel type de processus cela fait appelle ? 896 00:54:42,225 --> 00:54:44,915 (intervenant·e 4) Le débat est ouvert, je pense, 897 00:54:44,915 --> 00:54:46,785 parce que dans le cadre de cet événement, 898 00:54:46,785 --> 00:54:49,615 vous avez ces communautés intéressées... 899 00:54:49,615 --> 00:54:51,975 celles qui s'intéressent à Wikibase, 900 00:54:51,975 --> 00:54:54,002 celles qui s'intéressent à Wikidata, 901 00:54:54,002 --> 00:54:56,282 et celles qui s'intéressent aux deux. 902 00:54:56,282 --> 00:54:59,562 Oui, mais nous n'allons pas les obliger à aller vers Wikibase. 903 00:55:00,002 --> 00:55:03,118 - (i. 4) Pas nécessairement. - MusicBrainz ne tourne pas sur Wikibase. 904 00:55:03,118 --> 00:55:04,992 (i. 4) Non, je voulais simplement dire 905 00:55:04,992 --> 00:55:06,802 que ce sont des problèmes bien distincts. 906 00:55:06,802 --> 00:55:10,964 Parfois, ils sont reliés, parfois non, ils sont complètement séparés. 907 00:55:12,479 --> 00:55:16,573 Et j'avais une autre question ou remarque 908 00:55:16,573 --> 00:55:22,013 concernant la gestion des hiérarchies dans les vocabulaires contrôlés, 909 00:55:22,013 --> 00:55:26,473 comme la source, comme vous dans Finto. 910 00:55:27,703 --> 00:55:30,563 Vous avez les lieux... 911 00:55:31,503 --> 00:55:34,956 et les maoris... 912 00:55:36,418 --> 00:55:40,554 les rubriques maories... 913 00:55:42,262 --> 00:55:46,440 Eh bien, ils doivent faire face à la gestion des concepts 914 00:55:46,440 --> 00:55:48,360 dans la hiérarchie. 915 00:55:48,360 --> 00:55:52,320 Quelle est votre opinion 916 00:55:52,320 --> 00:55:57,042 sur la possibilité de gérer ce contrôle... 917 00:55:58,850 --> 00:56:02,364 de l'organisation des connaissances dans les Wikidata ? 918 00:56:07,166 --> 00:56:10,169 Je pense que dans le cas des lieux Finto et YSO, 919 00:56:11,499 --> 00:56:14,391 le référenciel sera une collection 920 00:56:14,391 --> 00:56:18,936 de plusieurs sources, à terme. 921 00:56:18,936 --> 00:56:21,613 Il est de toute façon en pleine mutation. 922 00:56:21,613 --> 00:56:24,528 Donc, nous n'avons pas besoin de... 923 00:56:24,528 --> 00:56:28,383 Bon, je ne représente pas la Bibliothèque nationale, 924 00:56:28,383 --> 00:56:31,512 mais dans ce projet potentiel, 925 00:56:31,512 --> 00:56:35,711 nous n'aurions pas à entretenir... 926 00:56:35,711 --> 00:56:38,540 ou plutôt, lutter avec une structure existante. 927 00:56:38,540 --> 00:56:40,414 Donc, en ce sens, 928 00:56:40,414 --> 00:56:45,394 il s'agit d'un domaine ouvert à l'exploration. 929 00:56:48,912 --> 00:56:54,311 Les rubriques maories semblent se prêter à la structure Wikidata, 930 00:56:54,311 --> 00:56:56,961 mais la licence, bien sûr, l'interdit. 931 00:56:56,961 --> 00:56:59,491 Si la licence était différente 932 00:56:59,491 --> 00:57:01,511 et que les données étaient mises dans Wikidata, 933 00:57:01,511 --> 00:57:04,562 si quelqu'un décidait qu'il n'en aimait pas la hiérarchie 934 00:57:04,562 --> 00:57:06,162 et tentait de modifier quelque chose, 935 00:57:06,162 --> 00:57:10,001 il y aurait un tollé immédiat des personnes ayant travaillé très dur 936 00:57:10,001 --> 00:57:12,301 pour créer cette structure 937 00:57:12,301 --> 00:57:15,641 et on chercherait à obtenir confirmation auprès des Maoris 938 00:57:15,641 --> 00:57:17,942 que c'était bien la bonne hiérarchie. 939 00:57:18,382 --> 00:57:20,841 C'est donc un problème qu'il faut essayer de résoudre. 940 00:57:23,812 --> 00:57:26,502 Je pense qu'en termes de connaissances des systèmes d'organisation, 941 00:57:26,502 --> 00:57:28,116 ils sont tous différents. 942 00:57:28,116 --> 00:57:31,752 Et je ne suis pas certain que ce serait une bonne idée 943 00:57:31,752 --> 00:57:36,855 de représenter les différentes hiérarchies dans Wikidata en tant que tel, 944 00:57:37,650 --> 00:57:42,101 mais ça peut être intéressant de réfléchir à des superpositions 945 00:57:42,941 --> 00:57:45,022 des données, 946 00:57:45,431 --> 00:57:48,371 et donc, de cartographier les contenus. 947 00:57:49,091 --> 00:57:54,021 Par exemple, en tant que partenaire ZBW pour le Thesaurus d'économie, 948 00:57:55,420 --> 00:57:59,150 ce thésaurus établit sa propre hiérarchie, 949 00:57:59,680 --> 00:58:04,020 et, bien sûr, il serait possible de projeter la hiérarchie 950 00:58:04,461 --> 00:58:08,452 de ce thésaurus en concepts Wikidata 951 00:58:08,452 --> 00:58:11,541 sans pour autant stocker ce type de structure 952 00:58:12,180 --> 00:58:14,840 comme structure alternative dans Wikidata 953 00:58:14,840 --> 00:58:18,640 ce qui créerait beaucoup de confusion. 954 00:58:18,640 --> 00:58:22,859 Mais je pense que nous devrions voir Wikidata 955 00:58:22,859 --> 00:58:24,789 comme un réservoir de concepts 956 00:58:24,789 --> 00:58:29,651 qui seraient connectés en couches extérieures, 957 00:58:30,264 --> 00:58:33,489 et donneraient une autre vision du monde 958 00:58:33,489 --> 00:58:39,080 mais qui ne feraient pas nécessairement partie de Wikidata. 959 00:58:45,775 --> 00:58:48,203 (assistant·e) Très bien. D'autres questions ? 960 00:58:49,096 --> 00:58:51,527 Sinon... d'accord. 961 00:58:54,769 --> 00:58:57,781 (intervenant·e 6) Joachim, je voulais juste donner suite à ce dernier point. 962 00:58:57,781 --> 00:59:01,064 Donc, ces couches, comme vous les imaginez, 963 00:59:02,196 --> 00:59:04,143 seraient-elles maintenues à l'extérieur 964 00:59:04,143 --> 00:59:07,404 et d'une manière ou d'une autre intégrées... 965 00:59:08,964 --> 00:59:11,764 à Wikidata, d'un point de vue Wikidata, 966 00:59:11,764 --> 00:59:17,143 ou avez-vous réfléchi un peu plus 967 00:59:17,143 --> 00:59:19,463 à la manière dont tout cela pourrait être géré ? 968 00:59:22,351 --> 00:59:24,931 En réalité, non, je n'ai pas... 969 00:59:25,271 --> 00:59:30,361 J'ai fait des essais avec ZBW et Wikidata. 970 00:59:30,361 --> 00:59:33,132 J'étais [inaudible] à Wikidata. 971 00:59:33,132 --> 00:59:38,837 Mais je pense que c'est une nouveauté tout à fait complexe, 972 00:59:39,261 --> 00:59:46,210 et donc, c'est sujet à débat, [de renoncer à beaucoup de contrôle] 973 00:59:46,409 --> 00:59:47,908 pour faire une telle chose. 974 00:59:47,908 --> 00:59:50,178 Mais il faudrait trouver une solution. 975 00:59:56,638 --> 00:59:57,959 Encore une autre ? 976 00:59:57,959 --> 00:59:59,686 (intervenant·e 5) Ah, super. 977 00:59:59,686 --> 01:00:02,628 J'avais une question concernant le projet kakapo. 978 01:00:03,875 --> 01:00:05,000 Mmh-mmh. 979 01:00:05,000 --> 01:00:10,805 (intervenant·e 5) OK, donc, avez-vous reçu un refus de la communauté Wikidata 980 01:00:10,805 --> 01:00:14,636 sur le fait de référencer des individus de la faune ? 981 01:00:15,576 --> 01:00:16,606 Pas encore. 982 01:00:16,606 --> 01:00:19,215 (i. 5) Quelqu'un a-t-il entendu parler de ce sujet auparavant ? 983 01:00:19,215 --> 01:00:20,245 « Pas encore » 984 01:00:20,245 --> 01:00:23,085 parce que personne n'en a encore entendu parler ? 985 01:00:23,085 --> 01:00:26,095 Ça fait déjà un certain temps qu'on en discute... 986 01:00:26,095 --> 01:00:29,235 avec des personnes intéressées dans ce genre de choses dans Wikidata, 987 01:00:29,235 --> 01:00:32,215 et nous semblons tous penser qu'il s'agit d'une extension naturelle 988 01:00:32,215 --> 01:00:34,355 d'accorder aux individus des articles Wikidata 989 01:00:34,355 --> 01:00:35,855 comme un cheval de course célèbre 990 01:00:35,855 --> 01:00:39,755 ou le chat de quelqu'un, qui... C'est assez bien modélisé. 991 01:00:39,764 --> 01:00:44,444 Je pense que l'audace, c'est d'y référencer toute l'espèce. 992 01:00:44,444 --> 01:00:48,113 Mais je pense que c'est tout à fait gérable. 993 01:00:48,113 --> 01:00:50,173 N'essayez pas avec des chats ou des chiens. 994 01:00:50,173 --> 01:00:52,027 (rires) 995 01:00:52,027 --> 01:00:54,337 (assistant·e) Parfait, je pense que le temps est écoulé. 996 01:00:54,337 --> 01:00:55,767 Merci beaucoup de votre présence. 997 01:00:55,767 --> 01:00:59,267 Nous sommes toujours ouverts aux questions durant la pause, 998 01:00:59,267 --> 01:01:00,797 et amusez-vous bien. 999 01:01:00,797 --> 01:01:02,292 Merci beaucoup. 1000 01:01:02,292 --> 01:01:04,047 (applaudissements) 1001 01:01:07,376 --> 01:01:11,376 WIKI DATA CON 2019 Wikidata et les langues