Help, onze data zitten vast

11071153656_686b687201_z

Personal Recollections of Birmingham and Birmingham men. Door: EDWARDS, E. – of Birmingham, British Library via Flickr.

Afgelopen maandag 14 april vond de derde sessie van de Masterclass Open Cultuur Data plaats. Deze keer gingen we in op een aantal technische aspecten van open data. Hoe stel ik mijn data beschikbaar? Hoe pak ik dat aan? Wat zeg ik tegen mijn systeembeheerder?

Help, onze data zitten vast

Een korte rondgang leert dat de eerste indruk is dat het lastig is om bij de data te komen: “het zit potdicht”! De data zitten als het ware opgesloten in de systemen en contracten die ooit gebouwd en opgesteld zijn toen het onderwerp open data nog niet op de agenda stond.

Culturele instellingen werken met uiteenlopende systemen waardoor het lastig is om een blauwdruk als oplossing te presenteren. In de masterclass werd daarom een aantal basisprincipes en tools besproken die als leidraad voor het openen van data kunnen dienen.

Start small, think big

Maarten Brinkerink (Nederlands Insituut voor Beeld en Geluid) laat aan de hand van het Open Beelden-platform zien hoe je openheid op verschillende niveau’s kunt implementeren. Open Beelden is een open mediaplatform dat toegang biedt tot audiovisuele collecties die eenvoudig hergebruikt kunnen worden.

Open Beelden is gebouwd op basis van open source software, stelt open videoformaten beschikbaar, werkt met open standaarden, open content (publiek domein en CC-BY-SA licentie) en heeft een Open-API (application programming interface).

Via Open Beelden wordt slechts 0,014% van het archief van Beeld en Geluid ontsloten, maar dat levert wel 50 miljoen raadplegingen op Wikimedia op. Met een relatief kleine selectie uit de collectie, wordt dus een significant resultaat geboekt.

Brinkerink geeft de volgende principes mee:

  • Bied materiaal aan dat gebruikt en gecombineerd kan worden door anderen. Met andere woorden – ‘Stimuleer de remixcultuur’;

  • Implementeer verschillende lagen van ‘open’, waarvan een Open API en Open Content de belangrijkste elementen zijn;

  • Bied Open Content aan onder Creative Commons-licenties of markeer deze als Publiek Domein;

  • Begin klein en blijf kwalitatief – ‘Start small, think big!’ – Je hoeft niet gelijk een besluit te nemen over je gehele collectie.

Giet de emmer vol

Lex Slaghuis (Open State Foundation) vervolgt met een verdieping op het onderwerp API. Via een API kun je gemakkelijk vragen uitwisselen en samen informatie verzamelen, zodat je elkaars werk niet over hoeft te doen – ‘Samen bouwen, waarin een ieder kan doorgroeien’.

Waarom is een API voor cultuurdata een goed idee? Als een ontwikkelaar nu aan de slag wil met cultuurdata moet hij veel tijd steken in het apart inladen van elke set. Elke ontwikkelaar moet dit weer opnieuw doen. Er zijn zoveel sets beschikbaar, dat hij door de bomen het bos niet meer ziet. Daarom is het handig om alle data op één centrale plek op het internet aan te bieden.

Instellingen die geen webbased systeem hebben, kunnen hun data via een export of dump op het web beschikbaar maken, instellingen die wel een webbased systeem hebben kunnen dat ook via een (live) API. De Open Cultuur Data-API kan deze data vervolgens harvesten en op een hoop gooien.

Slaghuis geeft de volgende principes mee:

  • Zet je data op het internet voor zover dat nog niet het geval is;

  • Maak niet alleen metadata maar vooral ook zoveel mogelijk content beschikbaar – ‘Limiteer je niet tot één soort, maar giet de emmer vol’;

  • Neem in je data links op naar de content, titels en beschrijvende informatie over de objecten, fulltekst of tags en categorieen helpen ontwikkelaars ook;

  • Stimuleer hergebruik door te beginnen met het openen van je eigen data, waardoor anderen zich hierbij kunnen aansluiten.

Samen bouwen

Wat kan de Open Cultuur Data-API voor je doen? Slaghuis presenteert de eerste opzet van de API die op dit moment in ontwikkeling is en die mede met de input en suggesties van ontwikkelaars en culturele instellingen gemaakt zal worden:

  • Via de API is zowel ruwe data als afgeleide data beschikbaar;

  • De broncode van de API is open. Ontwikkelaars kunnen de API op hun eigen laptop draaien en data en nieuwe algoritmen toevoegen (bijvoorbeeld kleurherkenning, tekstmining etc.);

  • Het is mogelijk het gebruik van de data in de API te meten (statistieken dus over het gebruik van je collecties, handig!).

Volgende maand organiseert de Open State Foundation een viertal Culture Harvests waarin ontwikkelaars datasets gaan inladen in de Open Cultuur Data-API. Binnenkort wordt ook een Challenge gelanceerd waarin ontwikkelaars uitgedaagd worden om met meerdere collecties en de API te gaan werken. De beste vier inzendingen worden begeleid om de ingestuurde applicaties verder te verbeteren.

Tijdens de volgende masterclass bijeenkomst gaan we verder in op beleidsmatige aspecten van open data. Tot die tijd onderzoeken de deelnemers verder hoe ze de data technisch gaan ontsluiten en werken ze toe naar het schrijven van een Datablog voor op deze website. Wordt vervolgd!

Onder leiding van Kennisland ontwikkelen de deelnemers in vijf plenaire bijeenkomsten een strategie voor het vrijgeven van collectiedata en worden ze begeleid in de implementatie daarvan. De masterclass vindt plaats in het kader van Open Cultuur Data in samenwerking met het Nederlands Instituut voor Beeld en Geluid en Open State Foundation. De reader van de Masterclass kan je hier downloaden.

2 Comments

Geef een reactie

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.