Hack-a-LOD

Tijdens de jaarlijkse Hack-a-LOD – dit was de vierde editie – werken enthousiaste ontwikkelaars een nacht en een dag aan toepassingen die gebruik maken van de Linked Open Data (LOD) uit en over Nederlandse erfgoedcollecties. Aangezien ons project als doel heeft de metadata over Amsterdams erfgoed als LOD te publiceren en te verbinden, was dit een goed moment om de data onder de aandacht te brengen en te toetsen of datagebruikers ermee uit de voeten konden.

Dit jaar was de hack-a-LOD nota bene in Amsterdam, in de Posthoornkerk, op 9 en 10 februari. Petra, Menno en Ivo waren aanwezig om vragen te stellen, waar nodig data ter plekke te verbeteren en – niet te vergeten – zelf een relevante toepassing te ontwikkelen. We hebben aan verschillende deelnemers uitgelegd hoe onze data was te gebruiken. Zeker drie teams hebben, voor zover we weten, met onze data geëxperimenteerd. Of en zo ja op welke manier ze zijn verwerkt kunnen we niet helemaal overzien.

Een van teams die  onze data bekeken had, was de winnaar van de publieksprijs. Zij hadden de Prentenmepper ontwikkeld, een mobiele app waarbij een tekening uit een erfgoedcollectie transparant kon worden weergegeven op het scherm en dankzij de camera zo precies mogelijk over de werkelijkheid kon worden gelegd. De app-gebruiker die dit het beste deed, kreeg de meeste punten. Maar ondertussen droeg de gebruiker bij aan de geografische ontsluiting van het tekening.

Winnaar van de juryprijs was het team van het KNAW/DH Lab. Hun “Jamie LODiver” vond recepten in kranten en tijdschriften en maakte allerlei soorten presentaties (het populairste recept uit een jaar) en analyses (hoeveel calorieen at men in welk seizoen) mogelijk.  Zij hadden verschillende technieken ingezet en publiek bediend varierend van geinteresseerde kok tot wetenschapper.

De verzorging van het evenement door NDE, KB en Rijksmuseum was heel goed: eten, drinken en (eventueel) slapen was van hoge kwaliteit. Ook de sfeer was heel goed. Teams hielpen elkaar waar nodig om tot de beste resultaten te komen. Reden genoeg om volgend jaar (weer) mee te doen.

Collecties verbinden met Wikidata

Wikidata items hebben elk een uniek id – een ‘Q’ gevolgd door een reeks cijfers.  Zo’n Wikidata id is heel bruikbaar als unieke identifier voor het één of ander in collectie metadata. Er is een Wikidata item voor Wim T. Schippers, maar ook voor pindakaas. Als je http://www.wikidata.org/entity/ voor zo’n id plakt, dan heb je een echte URI en meteen iets om op te klikken.

En er is meer. Het opnemen van zo’n Wikidata id verbindt je metadata met allerlei achterliggende data.  Zo hoef je zelf niet bij te houden dat Wim T. Schippers een man is en geboren in Groningen. Of dat pindakaas het gebruikte materiaal is voor een van zijn installaties.

Bij personen in Amsterdamse collecties proberen we zoveel mogelijk Wikidata id’s op te nemen. Om ze eenduidig te kunnen identificeren, maar ook om toegang tot die achterliggende data te krijgen.

Zo kunnen in de sample app ‘Portretten naar Beroep‘ geportretteerden waarvan we naast naam ook het Wikidata id kennen eenvoudig ingedeeld worden naar beroep. Opeens is nu te zien dat kunstschilders met afstand het meest voorkomen, maar dat er ook portretten van een juridisch dichter, een misdadiger en een brouwer zijn opgenomen.

Het overzicht van al die beroepen, die groter weergegeven worden naarmate ze vaker voorkomen, is letterlijk een kwestie van één query maken die zowel de Adamlink data als de Wikidata data bevraagt. Stel je eens voor hoe makkelijk je zo tijdens de Boekenweek alle schrijversportretten uit je collectie vist.

Bijkomend voordeel van Wikidata identifiers: als een item niet bestaat kan je het aanmaken!

Code op GitHub

Ben je benieuwd hoe het geportretteerden overzichtje is gemaakt? De code staat op GitHub.

LOD van Amsterdamse erfgoedcollecties

Stichting AdamNet biedt een SPARQL-endpoint aan waarin de metadata van  enkele Amsterdamse erfgoedcollecties gezamenlijk doorzoekbaar is. Je kunt de dataset bestuderen door linken te volgen en er is ook de plek bereikbaar die het mogelijk maakt om eens een SPARQL-query uit te proberen. We verbeteren de data voortdurend, dus wees niet verbaasd als het even niet werkt of ineens nog mooier is.

Het Rembrandthuis aan de Jodenbreestraat, foto van Jacob Olie, collectie Stadsarchief

Grootste collectie is de beeldbank van het Stadsarchief van Amsterdam. Ruim 400.000 foto’s, tekeningen en bouwtekeningen zijn hierin te vinden op basis van bijvoorbeeld een beschrijving, de fotograaf of tekenaar, of de straat. Deze straat hebben we gekoppeld aan de referentiedata van (verdwenen) Amsterdamse straten en gebouwen.

De opgenomen collectie van het Amsterdam Museum bevat ruim 120.000 objecten: van schilderijen tot theelepeltjes. Ook hier hebben we de naam van een straat gestandaardiseerd met een uri. Om het bevragen van de data gemakkelijker te maken, hebben we data over de straten aan de endpoint toegevoegd. Dat maakt het mogelijk om bijvoorbeeld de data over de Jodenbreestraat te bekijken.

In de collectie van het Amsterdam Museum zijn, indien aan de orde, ook verwijzingen opgenomen naar uri’s van de personendatabase ECARTICO. In deze database zijn ruim 30.000 beschrijvingen opgenomen van personen die een relatie hebben met de “creatieve industrie” in Nederland in de zestiende en zeventiende eeuw. Denk daarbij aan schilders (zoals Rembrandt) en andere soorten kunstenaars.

De moeder van Rembrandt, geportreerd door Rembrandt zelf, collectie Amsterdam Museum

Maar ook allerlei gerelateerde personen (zoals de moeder van Rembrandt) zijn opgenomen. Om queries te kunnen stellen over deze personen is deze dataset ook opgenomen.

Uit de collectie van de Openbare Bibliotheek van Amsterdam zijn ongeveer 20.000 publicaties over Amsterdam in de dataset opgenomen. De publicaties zijn gerelateerd aan de LOD-beschrijving uit de dataset  Nederlandse Bibliografie Totaal.

Zelf hebben we enkele eerste voorbeelden gemaakt van toepassingen die deze gecombineerde data mogelijk maakt. We zijn benieuwd naar jullie ideeën!

Dit project wordt financieel mogelijk gemaakt door Stichting Pica.

Verdwenen straten SPARQLen

Er zijn in Amsterdam vier Houtstraten geweest: de Grote, de Kleine, de Lange en de Korte. Daarvan bestaat nu alleen de Kleine Houtstraat nog. We hebben een applicatie gemaakt die laat zien hoe die Hout- en andere verdwenen straten er uitzagen.

Zelf aan de gang met (verdwenen) straten?

In het Adamlink Stratenregister zijn de verdwenen straten gewoon opgenomen. In de alfabetische overzichten en zoekresultaten zijn ze herkenbaar aan het kruisje achter hun naam. De straatdata is te downloaden, onder andere als geojson en rdf, vanaf de Adamlink data-pagina. De verdwenen straten zijn herkenbaar aan hun einddatum – bestaande straten hebben die niet.

De straten zijn met SPARQL ook via het AdamNet sparql endpoint op te vragen. Onderstaande query doet precies dat.

Ben je alleen geïnteresseerd in straten met geometrie, dan kan je je daartoe beperken. Je kan de resultaten dan ook meteen op de kaart bekijken (gebruik de geo-knop onder het query-venster).

Wil je weten hoe de verdwenen straten applicatie precies in elkaar zit, dan vind je de code op GitHub. In het kort komt het erop neer dat we één SPARQL query draaien om alle verdwenen straten op te halen (we maken met die gegevens een geojsonbestand, want het is nogal zwaar omdat elke keer opnieuw te doen) en één query om alle afbeeldingen bij een straat op te halen.

Een Amsterdams stratenregister dat collecties verbindt

Op Adamlink.nl vind je sinds kort een stratenregister met 6000+ bestaande en verdwenen Amsterdamse straten. Dat register maken we vooral om Amsterdamse collecties te verbinden en beter te ontsluiten.

Stratenmaker N. Genot (1897-1960), deelnemer aan de Februaristaking, tweede van links zittend op een kruk, met collega’s

Het Stadsarchief, het Amsterdam Museum, het IISG, de OBA – er zijn tientallen instellingen die foto’s, schilderijen of boeken van of over Amsterdamse straten in huis hebben. Met een beetje geluk hebben ze zo’n straatnaam dan als trefwoord opgenomen. Maar daarmee zijn we er niet. Het spellen van straatnamen blijkt lastiger dan je zou vermoeden – vraag maar eens twee mensen onafhankelijk van elkaar Sint Antoniesbreestraat op te schrijven.

Daarom is het handiger een eenduidige identifier te gebruiken. De BAG (Basisadministratie Adressen en Gebouwen) heeft goede id’s (tegenwoordig ook als URI leverbaar), maar kent geen naamvarianten of verdwenen straten. We hebben de BAG id’s bij bestaande straten opgenomen, nemen ook de verdwenen straten op en geven daarnaast nog wat extra informatie.

Welke data vind je in het register?

  • Elke straat heeft een eigen Adamlink identifier, en waar mogelijk ook een BAG id en een Wikidata id. De koppeling met Wikidata maakt het mogelijk vragen te stellen als ‘welke straten zijn vernoemd naar vrouwen?‘.
  • Geometrieën, meest lijngeometrieën uit het Nationaal Wegenbestand, bij verdwenen straten vaak zelf ingetekend. Er kunnen meerdere geometrieën – met periode van geldigheid – bij een straat gegeven worden, bijvoorbeeld wanneer een straat is verlegd, verlengd of verkort – zoals de Jodenbreestraat.
  • Naamvarianten, zo weten we niet alleen dat de Albert Luthulistraat voor 1987 de Louis Bothastraat heette, maar hebben we daar ook zo’n twintig schrijfwijzes van.
  • Periode van bestaan, bij vanaf eind 19e eeuw aangelegde straten hebben we raadsbesluiten waarin de naam vastgelegd werd als begindataum genomen.
  • Relaties tussen straten, zo zijn de Oude Teertuinen absorbedBy de Prins Hendrikkade, is de Marnixstraat originatedFrom de Schans en is de Bloemenmarkt partOf Het Singel.
  • Links naar de Wikipediapagina over de betreffende straat.

Al die data stelt erfgoedinstellingen, maar ook ‘de gewone Nederlander’ in staat eigen data te standaardiseren naar BAG, Wikidata of Adamlink URIs. Al die naamvarianten helpen daar natuurlijk bij. Dankzij de geometrieën wordt het geografisch weergeven van bijvoorbeeld collectiedata een stuk eenvoudiger.

Netwerk Oorlogsbronnen heeft afgelopen jaar de administratie van Kamp Vught met hulp van een enthousiaste crowd ingevoerd, en de adressen van de Amsterdamse slachtoffers (L.Bothastr, St. Anth.Breestr) konden met hulp van de Adamlink data snel op een kaart weergegeven worden.

Hoe kom je bij de data?

Het register is natuurlijk handmatig te doorzoeken en alfabetisch door te bladeren, maar de data kan ook, in verschillende formaten, opgehaald worden:

  • Op https://adamlink.nl/data zijn dumps van alle straten te downloaden als csv, geojson en turtle.
  • Je vindt daar ook een API die je kunt gebruiken om eigen data te standaardiseren.
  • Afzonderlijke straten kunnen ook als turtle, json, rdfxml of geojson opgehaald worden.
  • Op de AdamNet sparql endpoint kun je natuurlijk ook straten opvragen, en daarbij specifieke vragen stellen.

Is ’t al af?

Wat betreft identificatie hebben we de meeste straten er nu goed in zitten, maar een hoop, vooral verdwenen straten missen nog geometrie en periodisering. We blijven hier aan werken. Ook willen we nog meer historische naamvarianten toevoegen.

We zijn benieuwd naar gebruikerservaringen, horen graag vragen of suggesties en zijn altijd op zoek naar bruikbare data en hulp – laat het ons weten!