GLAMetrics: Nederlands cultureel erfgoed op Wikipedia bereikt maandelijks miljoenenpubliek
Er is een groeiende behoefte in de culturele sector naar het meten van de impact van het beschikbaar stellen van collecties als open data en open content, en tegelijkertijd is er – ook internationaal – geen partij die deze gegevens sectorbreed verzamelt. In 2014 is Open Cultuur Data een verkennend onderzoek gestart naar de (on)mogelijkheden om de impact van open cultuurdata te meten onder de naam GLAMetrics. Hiermee is een belangrijk begin gemaakt met de kwantitatieve bewijsvoering van de gevolgen van het openstellen van culturele data, ten behoeve van de gehele (internationale) sector. In deze blogpost beschrijven we de eerste uitkomsten van een onderzoek naar het hergebruik en bereik van Nederlands digitaal erfgoed binnen de Wikimediaprojecten; dit zijn de diverse projecten van de Wikimedia-gemeenschap, waaronder alle verschillende taalversies van Wikipedia zoals nl.wikipedia.org, maar bijvoorbeeld ook WikiSource en WikiData. MethodeOm te inventariseren welke open cultuurdatasets op dit moment aan Wikimedia Commons (het media-archief van de Wikimediaprojecten) zijn toegevoegd – en dus binnen Wikimediaprojecten kunnen worden hergebruikt – hebben we een enquête opgesteld en in oktober 2014 binnen het OCD-netwerk verspreid. Deze enquête is door 30 vertegenwoordigers van instellingen uit het netwerk ingevuld. Elf respondenten hebben momenteel één of meerdere open cultuurdatasets op Wikimedia, drie instellingen geven aan op het moment te werken aan een eerste publicatie. Vervolgens is met Wikimedia Nederland samengewerkt om het overzicht van Nederlandse cultuurinstellingen op Wikimedia zo compleet mogelijk te maken. Wikimedia biedt verschillende publiek beschikbare meetinstrumenten om data te verzamelen over het hergebruik en bereik van materiaal binnen de verschillende Wikimediaprojecten.* Vanaf november 2014 heeft OCD deze meetinstrumenten ingericht voor de Nederlandse erfgoedinstellingen op Wikimedia Commons. Het gaat specifiek om BaGLAMa 2 en GLAMorous:
Eerste bevindingenVanaf het moment dat we zijn gaan meten (november 2014), waren er 23 Nederlandse erfgoedinstellingen die één of meerdere collecties voor hergebruik in Wikimediaprojecten aanboden door één of meerdere collecties via Wikimedia Commons open te stellen. Sommige instellingen zijn nog maar enkele maanden op Wikimedia aanwezig (zo kwam in februari als 24e instelling Museum Catherijneconvent en in april het Textielmuseum als 25e instelling erbij), terwijl de eerste instelling op Wikimedia Commons – het Tropenmuseum – al meer dan 56 maanden content aanbiedt voor hergebruik.
Dankzij GLAMetrics weten we voor het hierboven beschreven aanbod inmiddels een stuk meer over het hergebruik en bereik hiervan:
Als uitsmijter biedt Wikimedia – naast maandelijkse statistieken – ook cijfers over het aantal raadplegingen van de pagina’s waarop het materiaal is hergebruikt over de gehele gemeten periode. Hoewel niet elke Nederlandse erfgoedcollectie vanaf het moment van beschikbaarheid is gemeten – dit verschilt van slechts een aantal tot maar liefst 56 maanden – zijn de cijfers van het bereik van deze collecties al zeer indrukwekkend: maar liefst 1,9 miljard keer zijn pagina’s met daarin Nederlands digitaal erfgoed geraadpleegd! Verwachtingen voor GLAMsMomenteel wordt bijna 7% van het gecombineerde aanbod aan Nederlandse digitale erfgoedobjecten in Wikimedia Commons daadwerkelijk op één of meerdere pagina’s van Wikimediaprojecten hergebruikt. Op basis van de verzamelde gegevens kunnen we ook een paar eerste voorzichtige verwachtingen uitspreken voor instellingen die overwegen om (een deel van) hun collectie via Wikimedia Commons open te stellen.
VervolgAls vervolg op deze eerste blogpost, zullen we elk kwartaal een update geven van hoe het hergebruik en bereik van Nederlands digitaal erfgoed op Wikimediaprojecten zich ontwikkelt. Bovendien hopen we, naar mate we meer data verzamelen steeds uitgebreidere bevindingen te kunnen presenteren. Zo gaan we kijken of we retroactief data over oudere collecties op Wikimedia kunnen vergaren, om zo ook ontwikkelingen over de (middel)lange termijn te identificeren. Verder willen we het hergebruik in verschillende taalversies van Wikipedia en andere Wikimediaprojecten met elkaar vergelijken en meten hoeveel van de totale Wikipedia verrijkt wordt met Nederlands digitaal erfgoed. Tot slot willen we kijken naar de invloed van activiteiten rondom een contentdonatie van een erfgoedinstellingen aan Wikimedia op het hergebruik (zoals bijvoorbeeld het organiseren van edit-a-thons). OproepWij zijn erg benieuwd naar feedback en suggesties, naar aanleiding van onze eerste bevindingen. Daarnaast worden wij graag op de hoogte gesteld van nieuwe contentdonaties van Nederlandse erfgoedinstellingen aan Wikimedia. Dit kan door de reageren op deze blogpost. Open onderzoeksdataGeheel in lijn met het gedachtengoed van OCD, is alle data die wij voor dit onderzoek hebben verzameld open beschikbaar voor hergebruik onder CC-0. Zoals hierboven aangegeven zijn wij erg benieuwd naar feedback, suggesties en analyses van anderen! * Kanttekening bij deze cijfers en meetinstrumenten is dat Wikimedia momenteel mobiel verkeer nog niet goed kan meten. Ook maakt Wikimedia geen onderscheid tussen raadplegingen van pagina’s door bezoekers en raadplegingen door machines (bijvoorbeeld zoekmachines, t.b.v. hun indexering). Naar schatting is dat zo’n 15%. Daarnaast heeft OCD niet kunnen ontdubbelen voor pagina’s van Wikimediaprojecten waarin materiaal van meer dan één erfgoedpartij wordt hergebruikt. Wij nemen echter aan deze kanttekeningen zich dusdanig tot elkaar verhouden dat de bovenstaande uitkomsten in ieder geval niet lager uitpakken. Op termijn hoopt OCD dat Wikimedia nog meer data over het hergebruik en bereik ter beschikking stelt, zoals geanonimiseerde data over het gedrag van bezoekers aan de pagina’s waarin Nederlands erfgoed is hergebruikt, zodat er meer te zeggen is over hoeveel tijd en aandacht de lezer besteedt aan het raadplegen van de specifieke erfgoedobjecten. Maarten Brinkerink (Nederlands Instituut voor Beeld en Geluid), met dank aan Lotte Belice Baltussen, Jesse de Vos, Maarten Zeinstra (Kennisland) en Tom Kunzler (Open State Foundation) voor hun suggesties |
Pingback: Cultureel erfgoed online beschikbaar maken via Wikipedia – IP | vakblad voor informatieprofessionals