.

Van metadata naar Linked Data: hoe werkt dat?

Een sleutelbegrip bij het verbinden van podiumkunstcollecties en -archieven is Linked Data. En het liefst Linked Open Data, zodat iedereen daarvan gebruik kan maken. “Linked Data is een digitale methode voor het publiceren van gestructureerde gegevens, zodanig dat deze beschikbaar gemaakt kunnen worden op het internet en daardoor ook beter bruikbaar zijn”, zegt Wikipedia. Podiumkunst.net adviseert instellingen bovendien om Linked Open Data te publiceren volgens de RDA standaard. Wat is ervoor nodig om een collectie of archief te publiceren als Linked Data volgens RDA?

RDA, hoe zat het ook alweer?

Een Podiumkunst.net werkgroep heeft verschillende modellen voor metadatering bekeken en uiteindelijk gekozen voor het conceptuele Library Reference Model (LRM). Resource Description and Access Model (RDA) is daarvan een uitwerking. LRM/RDA is een internationale standaard voor het beschrijven van metadata van bibliotheek- en cultureel erfgoedcollecties. Podiumkunst.net werkt aan een RDA applicatie- of toepassingsprofiel. Daarin staan allerlei afspraken, zoals welke minimale set van metadata nodig is. Het profiel maakt het onderling verbinden van collecties makkelijker.

Van metadata naar Linked Data

Muziekschatten, het bladmuziekarchief van de Stichting Omroep Muziek, is een van de eerste collecties die met behulp van het Podiumkunst.net platform metadata publiceert als Linked Data. In de ideale situatie publiceert elke podiumkunstinstelling zelf Linked Data volgens RDA op basis van het applicatieprofiel. In de praktijk is dat nog niet zo. Het Podiumkunst.net platform zal daarom een aantal voorzieningen bieden, waaronder een zogenaamde ‘wasstraat’ en een ‘triple store’. Podiumkunst.net test op dit moment die voorzieningen en past aan waar nodig.

Ter illustratie, Muziekschatten heeft het archief op een gestructureerde manier beschreven in een collectiebeheersysteem. De metadata is nog niet gepubliceerd als Linked Data in RDA. De Podiumkunst.net wasstraat transformeert – of vertaalt – de gestructureerde metadata uit een dataset van Muziekschatten naar Linked Data. De wasstraat gebruikt hiervoor het RDA applicatieprofiel. Vervolgens wordt de data gepubliceerd in een triple store. Deze triple store is een soort database die zogenaamde triples bewaard. Zo’n triple bestaat uit drie delen: een subject, predicaat en object. Het subject is bijvoorbeeld Louis Andriessen en het object is Andriessen’s compositie De Staat. Het predicaat is ‘de maker van’. Samengevoegd Louis Andriessen (subject) is de maker (predicaat) van De Staat (object). 

De triples maken links tussen informatie leesbaar en begrijpelijk voor computers. Meer informatie over triples en Linked Data is te vinden in het Spoorboekje Digitalisering Erfgoedcollecties.

In dit geval verzorgt het Podiumkunst.net platform in technische zin de transformatie van de metadata en de publicatie in Linked Data. De collectiehoudende instelling is én blijft echter de bronhouder van de metadata.

Een blik op de toekomst

In de komende periode zullen meer podiumkunstinstellingen metadata publiceren als Linked Data volgens de RDA standaard. Op die manier kunnen collecties verbonden worden en dat biedt mogelijkheden voor gebruikers, zoals liefhebbers van de podiumkunsten of onderzoekers. Zo zal een muziekliefhebber voor een zoekvraag als ‘In welke muziekcollecties vind ik werken van Harry Bannink, Spinvis, Alphons Diepenbrock of Tera de Marez Oyens?’ nu nog verschillende collecties moeten raadplegen. Met verbonden collecties kan de liefhebber de vraag straks op een centrale plek stellen.

door Mirjam Verloop