Länkrika objekt i K-Samsök

Bilden http://kulturarvsdata.se/shm/media/html/14378
Ulf Bruxe SHM

Inom öppna-länkade-data–kretsar pratar man ofta om att det är länkarna mellan digitala objekt som ger värde, snarare än objekten i sig. Länkar sätter ett objekt i sitt sammanhang genom att beskriva hur det relaterar till andra objekt och begrepp. Länkar pekar åt andra ställen som beskriver objektet, och upplyser om andra kopplingar, resurser, och tankebanor. Har man någon gång snabbt slagit upp något på Wikipedia, bara för att inse några timmar senare att man har ägnat halva kvällen åt att följa intressanta länkar från sida till sida tills man hamnat på någon skum artikel som knappast har någonting med det man ville ursprungligen kolla upp att göra… då förstår man väl länkarnas kraft!

K-samsöksplattformen existerar för att förvalta, beskriva, och tillgängliggöra semantiska länkar mellan olika digitala objekt från fler än fyrtio olika minnesinstitutioner. Antalet länkar mellan objekt i K-samsök varierar ganska mycket. Vissa objekt i K-samsöks index har knappast några länkar alls, medan andra sitter mitt i ett rikt nätverk av länkar till hundratals – eller ibland tusentals – andra objekt. Men vilka objekt har flest länkar?

Det är tyvärr inte en enkel fråga att besvara med K-samsöks API:er (K-samsök, UGC-hubben) som inte riktigt stödjer sådana frågeställningar. Men det är en förhållandevis enkel fråga för SPARQL, frågespråket på den semantiska webben och RDF-resurser. Som tur är har vi kvar en triplestore databasserver från förra årets ArkHack i Umeå, som har ett SPARQL gränssnitt och innehåller en delmängd av K-samsöks data från Göteborgs stadsmuseum, Helsingborgs museer, Riksantikvarieämbetet, Svenskt hällristnings forsknings arkiv, Statens historiska museum, och delar av K-samsöks UGC-hubb. Trots att det bara är ett urval ur K-samsöks index, och att datan är snart ett år gammal, så borde detta ändå kunna ge en grov uppskattning om antalet länkar.

Tyvärr – igen – har maskinen med triplestoredatabasen ganska dålig prestanda nuförtiden (den skapades ju bara för ett tillfälligt hack) och klarade inte av att räkna ihop samtliga länkar för alla objekt. Det gick däremot att begränsa frågeställningen något och fråga om vilka objekt som har flest av en specifik sorts länk. I det här fallet valde jag avbildningar – vilka K-samsöksobjekt har flest bilder på sig? Enligt servern är K-samsöks fem-i-topp objekt med flest bilder:

  1. Ållebergskragen, med 160 bilder.
  2. Engelbrektskyrkan, med 136 bilder.
  3. Gamla Uppsala, med 128 bilder.
  4. Mönehalskragen, med 126 bilder.
  5. Ulrika Eleonora Kyrka, med 117 bilder.

Fint!

Men frågan om K-samsöks länkrikaste objekt behöver kanske ändå inte förbli obesvarad. För det finns nämligen ett litet antal kända objekt som har många gånger fler kopplingar till andra objekt än bara några hundra bilder. Sådana objekt har såpass många länkar att det inte går att visa samtliga på Kringla för att sidan skulle ta för lång att ladda. Ett sådant exempel är fornlämningen Bystan, Birka (Adelsö 119:1) som undersöktes 1990–1995 och har länkar till sina alla 106.786 fynd! Bara 89 visas i Kringla, men användare av K-samsöks API kan få ut en fullkomlig lista. Det kanske slår rekordet för K-samsöks länkrikaste objekt!

Ni kan bidra till att öka antalet länkar i K-samsök ni med, och därmed kvalitetshöja datan genom att lägga till länkar i vår UGC-hubb. Det är bara att logga in på Kringla.nu och skapa nya länkar mellan objekt, både inom K-samsök och på Wikipedia, Wikimedia, Libris, Platsr, samt Europeana!

Skriv en kommentar