Tijdens de SWIB18 conferentie in Bonn presenteren we de resultaten van AdamLink. In ons project hebben we metadata uit verschillende erfgoedcollecties gecombineerd, zo bruikbaar mogelijk gemaakt en vervolgens aangeboden om door zoveel mogelijk mensen te gebruiken. Om onze dataset zo bruikbaar mogelijk te maken hebben we transformaties uitgevoerd. Zo vertalen we bijvoorbeeld allerlei veldnamen naar een aantal gemeenschappelijke properties, standaardiseren het gebruik van uri’s en hebben enkele eigen data toegevoegd. In ons stuk ‘Transformations for aggregated linked open data‘ en onze presentatie geven we een overzicht van de soorten transformaties die we denken dat noodzakelijk zijn als je data bij elkaar brengt om eenvoudig doorzoekbaar te kunnen aanbieden.
Beter half werk leveren dan niets doen!
Afgelopen jaar heb ik verschillende presentaties mogen houden over het project. De vraag van een erfgoedinstelling was daarbij vaak: “Ik wil ook mijn data op deze manier beschikbaar stellen! Maar waar moet ik beginnen!?”.
Om een antwoord te geven op die vraag heb ik negen activiteiten op een rijtje gezet, gecategoriseerd in drie groepen. Ze komen terug in deze presentatie die ik voor het eerst gaf voor de leden van AdamNet in april 2018. In deze blog leg ik ze kort uit.
Voordat ik dat doe nog het volgende. Als je één van de activiteiten doet, is dat al beter dan helemaal niets. Vaak is het ook zo dat iets half kunt doen, bijvoorbeeld voor maar een deel van je collectie. Zo zijn we natuurlijk niet opgevoed. We willen het graag helemaal goed doen, maar bij het beschrijven van erfgoed zijn we nooit klaar. Er zijn altijd aanvullingen en verbeteringen te verzinnen. Dat geldt ook voor het verbeteren van je metadata om deze geschikt te maken voor publicatie als Linked Open Data (LOD). Enthousiast? Google de termen die je niet begrijpt: er is allerlei uitleg beschikbaar.
Leg rechten vast. We kunnen alleen data gebruiken waarvan duidelijk is dat er voor het gebruik geen juridische belemmeringen zijn (denk aan auteursrecht, openbaarheidsbeperkingen of privacywetgeving). Leg daarom bij objecten vast welke rechten er gelden. Als je het niet van alle objecten weet: ook goed, dan beperken we de publicatie straks tot de objecten waarvan we zeker weten dat het mag.
Introduceer URI’s. Elk object moet op het internet zijn te identificeren door een uniek webadres, dat bovendien voor altijd zal blijven werken. De uitspraken over het object (“deze ets is gemaakt door Rembrandt”) zijn aan deze zogenaamde uniform resource identifier (URI) te relateren. Een Persistent Identifier (PID) kan meestal als URI worden gebruikt.
Link de data. Je beschrijft een object door daarover uitspraken te doen: bv. “deze ets is gemaakt door Rembrandt”. In plaats van de tekst “Rembrandt” te linken, kun je beter Rembrandt kiezen uit een lijst van standaardnamen. Deze standaardnamen kunnen net als de objecten worden geidentificeerd met een URI. Dit geldt behalve voor personen ook voor bijvoorbeeld plaatsnamen en objectsoorten.
Zet de dataset online. Volgende stap hoeft niet moeilijk te zijn. Sla je data uit je database op in een bestand en zet dit bestand op je website. Iemand die op je website op het bestand klikt kan deze dan downloaden en gebruiken. Natuurlijk is het ene bestandsformaat handiger dan het andere, maar elk formaat is beter dan niets online zetten.
Zet de dataset online in RDF-formaat. Als je URI’s beschikbaar hebt en je data hebt gelinkt, kun je er voor kiezen om de data aan te bieden in een vorm van Resource Description Framework (RDF). Elke uitspraak over je object (bv. “Deze ets is gemaakt door Rembrandt”) is dan vertaald naar “triples”. Nu heb je Linked Open Data gepubliceerd!
Publiceer de data per object. Soms wil een gebruiker niet een volledige dataset met al je objecten en wil hij alleen iets weten over die ene ets. In dat geval moet je het in de website mogelijk maken om alleen die data te leveren via de URI van dat ene object. Er is dan sprake van een resolvable URI.
Bied een synchronisatie-mechanisme. Een gebruiker die je data regelmatig downloadt, wil na de eerste keer misschien alleen maar alle wijzigingen weten. Een synchronisatie-protocol zoals OAI-PMH of Resource Sync maakt dit mogelijk.
Bied een API. Een Application Programming Interface maakt het mogelijk dat een gebruiker een deel van de data opvraagt. Een API levert meestal data aan in JSON-formaat.
Bied een SPARQL-endpoint. Op een SPARQL-endpoint kan een gebruiker vragen aan de data stellen op alle manieren die hij of zij kan bedenken. Het is speciaal bedoeld voor Linked Open Data.
De laatste vier paragrafen zijn heel technisch. Dit is niet de plaats om daar verder op in te gaan. Laat je daar vooral niet door afschrikken. Het verbeteren van de data is een belangrijke stap in het beschikbaar maken van LOD en is belangrijker dan de realisatie van de techniek. En met data verbeteren kan iedereen beginnen. Actie!
Reis door de Tijd met de Noord/Zuidlijn
Amsterdammers en GVB, gefeliciteerd met de Noord/Zuidlijn!
De Amsterdamse cultureel erfgoedinstellingen (AdamNet) bieden jullie daarom graag bij de opening van het nieuwe traject de erfgoedsite adamlink.nl/nzlijn aan.
Reis op de site per metrostation door het Amsterdamse cultureel erfgoed. Bekijk foto’s, tekeningen, kaarten, boeken uit het (recente) verleden waar je nu ongezien onderdoor rijdt. Ga zelf op onderzoek in onze collecties, of stap uit en breng een bezoek aan jouw eigen straat.
De culturele erfgoeddata ontsluiten we binnen het project AdamLink als Linked Open Data (LOD). Met deze techniek is het mogelijk om nieuwe verbanden te leggen tussen verschillende databronnen. Perfect voor onderzoeken, werkstukken of om op reis te gaan door de enorme rijkdom van het cultureel Amsterdams erfgoed.
Reis door de Tijd is ontwikkeld door AdamNet in samenwerking met NoProtocol. Het zoeken in de straten van Amsterdam is ontwikkeld door studenten van de HvA.
AdamNet is een netwerk van Amsterdamse bibliotheken. Doel is samenwerken in het beschikbaar stellen van informatie over collecties en activiteiten. In het project werkten samen: de Openbare Bibliotheek Amsterdam, de Bibliotheek UvA/HvA, de universiteitsbibliotheek VU, het Internationaal Instituut voor Sociale Geschiedenis, het Amsterdam Museum en het Stadsarchief Amsterdam. Deze productie werd financieel mogelijk gemaakt door Stichting Pica.
Tot ziens op adamlink.nl/nzlijn!
Verbindingen tussen collecties dankzij (oude) adressen
In Adamlink hebben we veel voorwerpen kunnen verbinden aan een straat, persoon of gebouw. Veel van de voorwerpen in de erfgoedcollecties zijn echter nog gedetailleerder ontsloten en hebben ook een adres in de beschrijving. Om bijvoorbeeld foto’s of prenten nog preciezer op een kaart te kunnen lokaliseren hebben we – net als bij de straten – een lijst van bestaande en niet meer bestaande adressen nodig. En de koppeling daartussen: het pand dat vroeger Jodenbreestraat 1 heette is niet hetzelfde pand dat nu Jodenbreestraat 1 heet.
In een project van CLARIAH en Amsterdam Time Machine werken we samen met HisGIS aan de Fryske Akademy in Leeuwarden om deze lijst van adressen te maken. Daar hebben ze namelijk veel ervaring opgedaan met het reconstrueren van adressen in steden. Ze gaan daarbij uit van de concordans die door het Stadsarchief beschikbaar wordt en verbeteren deze op basis van ondermeer de kadasterkaart (1832) en de kaart van Loman (1876). Naast de veranderingen in adressen, leggen ze ook de plaats op de kaart vast.
Behalve in de metadata over erfgoed zitten adressen ook in veel oude registraties, bijvoorbeeld de kiezerslijsten of de ledenadministratie van de diamantbewerkersbond (ANDB). Zodra dit soort registraties worden ingevoerd, kunnen ze snel en eenvoudig op een kaart worden weergegeven.
De Fryske Akademy heeft de ingewikkelde delen van de stad (het centrum en de Jordaan) al verwerkt. Zodra het af is, gaan we de erfgoedcollecties koppelen. We kunnen bijna niet wachten…
Lab-toepassingen op Hack-a-LOD
Tijdens de Hack-a-LOD hebben we twee nieuwe lab-toepassingen ontwikkeld om te laten zien hoe de AdamLink data kan worden gebruikt.
Menno werkte samen met Bert Spaan aan een betere ontsluiting van kaarten in de beeldbank van het Stadsarchief. Daarvoor rekenden ze de omtrek uit van elke kaart en sloegen deze op als LOD in onze Triple Store. Hierdoor is het nu mogelijk een SPARQL-query te stellen met als resultaat de kaarten die betrekking hebben op het gevraagde punt op de kaart. Dit wordt heel mooi gedemonstreerd in de tool “MapMe!” van Menno (op github). Het initiatief werd op Twitter met veel enthousiasme ontvangen. Richard Zijdeman postte een filmpje op Twitter om de werking uit te leggen en onder aandacht te brengen bij een internationaal publiek. Op de website van Bert staat Amsterdam op de Kaart, waarbij onderscheid gemaakt is tussen de tijden (op github).
Looking for that awesome historical map depicting your house or workplace?! @mmmenno c.s. created MapMe: automated retrieval of historical maps through Linked Open Data. Check the video or do it yourself at https://t.co/tzmbZXo9uW @KB_Nederland @HackaLOD @AdamNet_NL @DataLabAdam pic.twitter.com/MDoiFPeAtb
— Richard Zijdeman (@rlzijdeman) February 16, 2018
Petra en Ivo werkten aan het weergeven van familierelaties tussen personen om daarnaast de beschikbare portretten van deze personen te laten zien. Dit is mogelijk dankzij de koppeling tussen de portretten en Wikidata, zoals Menno eerder beschreef. We hebben de toepassing beperkt tot de leden van twee Amsterdamse families – Backer en Bicker – die een rol spelen in het jongste boek van Gabri van Tussenbroek. Naast de beschikbare portretten in de collecties van het Amsterdam Museum en het Stadsarchief, hebben we ook de collectie van het Rijksmuseum aangesloten. Dat had echter wel als consequentie dat de query erg lang duurt (ca. 8 seconden). Het is Petra gelukt in korte tijd een webinterface te maken, die ze op de lab-website heeft gezet (op github).
Menno en Bert gooiden hoge ogen bij de publieksprijs: ze werden gedeeld derde.
Hack-a-LOD
Tijdens de jaarlijkse Hack-a-LOD – dit was de vierde editie – werken enthousiaste ontwikkelaars een nacht en een dag aan toepassingen die gebruik maken van de Linked Open Data (LOD) uit en over Nederlandse erfgoedcollecties. Aangezien ons project als doel heeft de metadata over Amsterdams erfgoed als LOD te publiceren en te verbinden, was dit een goed moment om de data onder de aandacht te brengen en te toetsen of datagebruikers ermee uit de voeten konden.
Dit jaar was de hack-a-LOD nota bene in Amsterdam, in de Posthoornkerk, op 9 en 10 februari. Petra, Menno en Ivo waren aanwezig om vragen te stellen, waar nodig data ter plekke te verbeteren en – niet te vergeten – zelf een relevante toepassing te ontwikkelen. We hebben aan verschillende deelnemers uitgelegd hoe onze data was te gebruiken. Zeker drie teams hebben, voor zover we weten, met onze data geëxperimenteerd. Of en zo ja op welke manier ze zijn verwerkt kunnen we niet helemaal overzien.
Een van teams die onze data bekeken had, was de winnaar van de publieksprijs. Zij hadden de Prentenmepper ontwikkeld, een mobiele app waarbij een tekening uit een erfgoedcollectie transparant kon worden weergegeven op het scherm en dankzij de camera zo precies mogelijk over de werkelijkheid kon worden gelegd. De app-gebruiker die dit het beste deed, kreeg de meeste punten. Maar ondertussen droeg de gebruiker bij aan de geografische ontsluiting van het tekening.
Winnaar van de juryprijs was het team van het KNAW/DH Lab. Hun “Jamie LODiver” vond recepten in kranten en tijdschriften en maakte allerlei soorten presentaties (het populairste recept uit een jaar) en analyses (hoeveel calorieen at men in welk seizoen) mogelijk. Zij hadden verschillende technieken ingezet en publiek bediend varierend van geinteresseerde kok tot wetenschapper.
De verzorging van het evenement door NDE, KB en Rijksmuseum was heel goed: eten, drinken en (eventueel) slapen was van hoge kwaliteit. Ook de sfeer was heel goed. Teams hielpen elkaar waar nodig om tot de beste resultaten te komen. Reden genoeg om volgend jaar (weer) mee te doen.
LOD van Amsterdamse erfgoedcollecties
Stichting AdamNet biedt een SPARQL-endpoint aan waarin de metadata van enkele Amsterdamse erfgoedcollecties gezamenlijk doorzoekbaar is. Je kunt de dataset bestuderen door linken te volgen en er is ook de plek bereikbaar die het mogelijk maakt om eens een SPARQL-query uit te proberen. We verbeteren de data voortdurend, dus wees niet verbaasd als het even niet werkt of ineens nog mooier is.
Grootste collectie is de beeldbank van het Stadsarchief van Amsterdam. Ruim 400.000 foto’s, tekeningen en bouwtekeningen zijn hierin te vinden op basis van bijvoorbeeld een beschrijving, de fotograaf of tekenaar, of de straat. Deze straat hebben we gekoppeld aan de referentiedata van (verdwenen) Amsterdamse straten en gebouwen.
De opgenomen collectie van het Amsterdam Museum bevat ruim 120.000 objecten: van schilderijen tot theelepeltjes. Ook hier hebben we de naam van een straat gestandaardiseerd met een uri. Om het bevragen van de data gemakkelijker te maken, hebben we data over de straten aan de endpoint toegevoegd. Dat maakt het mogelijk om bijvoorbeeld de data over de Jodenbreestraat te bekijken.
In de collectie van het Amsterdam Museum zijn, indien aan de orde, ook verwijzingen opgenomen naar uri’s van de personendatabase ECARTICO. In deze database zijn ruim 30.000 beschrijvingen opgenomen van personen die een relatie hebben met de “creatieve industrie” in Nederland in de zestiende en zeventiende eeuw. Denk daarbij aan schilders (zoals Rembrandt) en andere soorten kunstenaars.
Maar ook allerlei gerelateerde personen (zoals de moeder van Rembrandt) zijn opgenomen. Om queries te kunnen stellen over deze personen is deze dataset ook opgenomen.
Uit de collectie van de Openbare Bibliotheek van Amsterdam zijn ongeveer 20.000 publicaties over Amsterdam in de dataset opgenomen. De publicaties zijn gerelateerd aan de LOD-beschrijving uit de dataset Nederlandse Bibliografie Totaal.
Zelf hebben we enkele eerste voorbeelden gemaakt van toepassingen die deze gecombineerde data mogelijk maakt. We zijn benieuwd naar jullie ideeën!
Dit project wordt financieel mogelijk gemaakt door Stichting Pica.