Taggad: kulturarvsdata

Att söka bland kulturarv

Webbplatsen Kringla är ett gränssnitt mot K-samsök, en samsökningstjänst för kulturarv där du kan söka i samlingar hos mer än sextio svenska museer, arkiv och register. Under 2018 besöktes Kringla 256 010 gånger (i genomsnitt gjordes 701 besök per dag).  En stor del av besökarna hittade något av alla sju miljoner kulturarvsobjekt via Google och klickade sig sedan inte vidare på Kringla, men det var också många besökare som sökte i innehållet efter sådant de var intresserade av. Vad kan vi utläsa av webbstatistiken att användarna var intresserade av att hitta?

Skärmdump av Kringla

På Kringla finns det flera olika sätt att söka i samlingarna:

  • Fritextsökfältet högst upp där användaren kan skriva in egna sökord eller bara trycka på ”Sök” för att få upp alla objekt
  • Kartsökning (finns länkad under fritextfältet)
  • Detaljerad sökning med olika fasta fält (finns länkad under fritextfältet)
  • Fasta sökingångar på startsidan (kategorierna Föremål, Fotografier osv)

Utöver de olika sökvägarna kan användaren också filtrera sökresultatet på olika sätt på sökresultatsidan. Olika söksätt går förstås att kombinera, till exempel genom att fritextsöka och sedan avgränsa sökresultatet genom att trycka på de givna kategorierna på sökresultatsidan.

Fritextsökningar

Nästan 37 000 olika sökord användes under 2018 – det inkluderar dock olika kombinationer av söktermer samt stor/liten bokstav, till exempel räknas ”Malmö”, ”malmö” och ”malmö chokladfabrik” som tre olika söktermer, så i praktiken handlar det om färre ord.

De 50 vanligaste sökorden består framför allt av platsnamn och namn på ting eller företeelser, fördelat på ungefär hälften platsnamn och hälften övriga substantiv. Enstaka personnamn och företagsnamn förekommer också. Platsnamnen är till stor del småorter i Sverige (Matfors, Malung m fl), men även Grekland finns med bland de vanligaste söktermerna. Tingen som finns bland sökorden är blandade, allt från järnväg till ljusstöpningsform.

De tio vanligaste söktermerna 2018, återgivna som de skrevs in i sökfältet:

  1. same
  2. malmberget
  3. Nätra
  4. Malmö
  5. Carl Larsson
  6. streiff
  7. björkvril
  8. bommars
  9. Hablingbo Burge
  10. ankarede

Flera av dessa sökord fanns även med på topplistan 2017.

Kategori-sökningar

De övriga sätten att söka på har att göra med kategorier och andra fasta avgränsningar, till exempel vilken typ av objekt (byggnad, fotografi osv) det handlar om eller vilken minnesinstitution som ansvarar för objektet. Användningen av dessa kategorier är svår att överblicka, men hur många gånger sökresultat som använder en viss filtrering har visats kan ge en fingervisning om hur de används. Antalet sidvisningar är antalet gånger sidor har laddats och säger inget om hur många användare det rör sig om eller hur många söktermer som har kombinerats i samma sökning. Siffrorna säger alltså mer om förhållandet mellan olika typer av kategoriseringar än om hur många sökningar som görs.

Diagrammet nedan visar antalet visningar av sökresultatsidor som använder någon av de fasta kategorier i K-samsök som finns som sök- eller filtreringsmöjlighet i Kringla. Kategorier som har med geografi att göra har här slagits ihop till ”Geografisk avgränsning”, tidskategorier är sammanslagna till ”Avgränsning i tid” och ”Övrig metadata” omfattar sökfält/filtreringar som har använts väldigt lite under året (till exempel ID-nummer).

Stapeldiagram: Antalet sidvisningar för olika sökavgränsningar i Kringla 2018. Typ av objekt är klart vanligast, därefter följer Geografisk avgränsning, Förvaltande organisation, Avgränsning i tid, Rättigheter för innehållet, Ämne samt Övrig metadata.

Typ av objekt (fotografier, föremål, kulturlämningar osv) är den klart vanligaste avgränsningen i sökresultaten. Det är en väl synlig kategori på Kringla: flera av objektstyperna finns som fasta sökingångar på startsidan, det är också den kategori som ligger högst upp bland filtreringsalternativen på sökresultatsidan och den finns dessutom med under detaljerat sök. Även med det i åtanke är det stor skillnad mellan hur ofta typ av objekt används som avgränsning jämfört med övriga kategorier. Den typ av avgränsning som används näst mest – den geografiska som utgörs av flera olika fält och kategorier (inklusive kartsök) – når inte ens upp till en fjärdedel av sidvisningarna för objektstyperna.

Det är också klart vanligare att avgränsa söket geografiskt än att göra tidsavgränsningar. Här verkar det vara vanligare att filtrera sökresultatet enligt landskap än att använda kartsökningen, men landskaps-kategorin är troligen också mer synlig för de flesta användare än vad kartsöksmöjligheten är. Även bland fritextsökningarna är platser vanliga, se ovan.

”Rättigheter för innehållet” har att göra med hur bilder och annan media får användas, och eftersom fria licenser (Public Domain Mark, CC BY) är vanligast bland de sökresultaten rör det sig sannolikt ofta om besökare som vill hitta bilder de kan använda sig av.

I stapeln ”Typ av objekt” gömmer sig så klart många olika objektstyper eftersom innehållet i K-samsök är väldigt varierat. Men det är tydligt att sökningar bland fotografier är klart mest populärt, medan vissa typer av objekt knappt aktivt sökts fram alls:

Stapeldiagram: Antal sidvisningar för sökresultat för olika typer av objekt. Fotografier har den högsta stapeln. Kategorierna Föremål, Byggnad, Kulturlämning, Dokument, Person, Karta, Konstverk, Ritning, Bok, Kulturmiljö och Film/Video följer i en snabbt fallande mängd. Övriga objekttyper i Kringla används väldigt lite i sökningar.

Antalet sidvisningar för sökresultat som är avgränsade till fotografier utgör faktiskt en åttondel av alla sidvisningar på Kringla 2018! I jämförelse med övriga typer av kategorier har dock även objektstyperna Föremål, Byggnad och Kulturlämning relativt stor användning.

Sökstatistiken speglar inte riktigt fördelningen av innehållet i K-samsök/Kringla — den största kategorin där är föremål (3 miljoner objekt i skrivande stund), följt av fotografier (2 miljoner objekt), kulturlämningar (1 miljoner objekt) och dokument (500 000 objekt).

Sammanfattningsvis

En stor del av sökningarna i Kringla handlar om bilder eller om objekt kopplade till en viss geografisk plats — säkert ofta i kombination. Det finns också tydligt både användare som söker efter något specifikt (till exempel ”dosspänne”) och användare som hellre vill se allt som finns inom en viss kategori (till exempel alla objekt som har med Anundsjö att göra). Bland sju miljoner objekt från över sextio olika källor finns goda möjligheter att hitta det man söker, men också en stor utmaning i att hitta rätt i ett innehåll som har så skiftande karaktär.

Generösa användargränssnitt – vad är det?

Tänk dig att du för första gången besöker ett museum. Du går in i museet, men du möts inte av ett urval föremål utan av en intendent bakom en disk. Det finns en informationsskylt som säger att det är en konstsamling och att museet har 72 384 konstföremål. Du är välkommen att titta på dem, men du måste skriva ner ett eller flera nyckelord på ett papper för att beskriva vilka konstföremål du vill ta en närmare titt på. Intendenten tar därefter pappret, går in i magasinet och hämtar ut föremålen, 10 åt gången, på ett rullbord. Du kan därefter modifiera dina nyckelord baserat på av intendenten förvalda konsthistoriska termer. Gör du det tar intendenten bort de konstföremål på rullbordet som inte matchar de termer du valde. Processen upprepas tills dess du är nöjd med urvalet på rullbordet.

Designern och designforskaren Mitchell Whitelaw använde denna liknelse i sin artikel, ”Generous Interfaces for Digital Cultural Collections”, för att beskriva hur han och många användare upplevelser de flesta söktjänster för digitala kulturarvssamlingar som då fanns online. Han menade att denna upplevelse var ”snål” (”stingy”) och enbart fungerar för de som redan vet exakt vad de letar efter och kan formulera en nyckelordssökning som matchar de termer som används av oss i kulturarvssektorn. I artikeln försöker han därefter att definiera karakteristika för generösa användargränssnitt (”generous interfaces”) och även ge exempel på några sådana.

Screenshot of Discover the Queenslander
Discover the Queenslander. Ett av de exempel Whitelaw använder.

Efter att Whitelaw skrev artikeln 2015 har det förstås tillkommit flera exempel – flera av dessa kan du hitta i denna översikt som John Stack från Science Museum gjort. På konferensen EuropeanaTech 2018 presenterade Whitelaw en statusuppdatering för hur generösa användargränssnitt har kommit att utvecklas sedan 2015. I uppdateringen definierar Whitelaw också fyra designprinciper för generösa användargränssnitt:
– Show first, don’t ask (provide rich overviews without search)
– Provide samples and clues (using collection content)
– Show relationships (between collection features)
– Provide rich primary content (deliver on the promise)

Under 2018 och en liten bit in på detta året har vi på Riksantikvarieämbetet, tillsammans med Nordiska museet, Nationalmuseum, Statens museer för världskultur, och Malmö museer, arbetat med att utvärdera generösa användargränssnitt. Syftet är att testa i praktiken om och hur svenska kulturarvsinstitutioner skulle kunna utveckla generösa användargränssnitt och även undersöka hur generösa användargränssnitt upplevs av användarna. Under arbetets gång har vi användartestat tre existerande generösa användargränssnitt och även utvecklat, eller låtit utveckla och användartesta, fyra egna fungerande generösa användargränssnittsprototyper baserade på svenska kulturarvssamlingar.

A screenshot of the splashcreen for the application COINS.
COINS – en av de existerande applikationer vi användartestade.

Givetvis ingår det också att vi delar med oss av resultaten, de positiva såväl som de negativa, så brett som möjligt. Denna bloggpost är därför den första av en serie där vi presenterar vårt arbete med generösa användargränssnitt, de prototyper vi utvecklat och testat, och de lärdomar vi dragit. Onsdagen den 23 januari kommer en bloggpost om prototypen ”Faces of Sweden” som gör det möjligt för användare att utforska och visuellt jämföra samlingsinnehåll via en interaktiv tidslinje.

Vi hoppas också att under året att presentera våra resultat på museikonferenser och seminarier runt om i landet. Mer om dessa när vi vet tid och plats!

Vi levererar kulturarvsdata till Hack for Sweden

Stereofotografi, (bruntonat), monterat på grå papp: ”Erik 1908” Källa: Helsingborgs museer, utgången upphovsrätt

Nu är det snart dags igen för den årligt återkommande tävlingen  Hack for Sweden. Bakom tävlingen står ett 30-tal myndigheter som med sin öppna data vill inspirera deltagarna till att skapa lösningar eller koncept som ger medborgarnytta. Riksantikvarieämbetet har varit med varje år och vårt mål med att delta är att fler ska få kännedom om den fantastiska guldgruva som kulturarvsdata är.

I år kommer vi bland anat att lyfta fram våra datamängder kring kulturlämningar och bebyggelse, geografisk data om våra världsarv samt rykande färska 3D-data från Glimmingehus som är ett av våra besöksmål. Är du intresserad av 3D så finns även möjlighet att jobba med forna tiders 3D, då vi genom K-samöks API tillgängliggör  över 2000 stereobilder.

Unikt i för i år är att vi får sällskap av den nyligen inrättade kulturarvsinkubatorn som ni kan träffa tillsammans med oss på utställningsytan på Norrsken House.

Exempel på användning av kulturarvsdata
Vår kulturarvsdata kan exempelvis användas genom unika namn på platser för att underlätta för utryckningsfordon ska hitta rätt eller genom tjänster som möjliggör insamling av berättelser och minnen kopplade till vår gemensamma historia. Det finns en uppsjö av historiska fotografier och ”rolig information”- exempelvis platsen som inspirerade till visan ”Mors lilla Olle”, ett UFO-monument och byggandsminnesmärkta utedass.

Så här tycker Caroline Ekstrandh som är utmaningsansvarig på Hack for Sweden om Riksantikvarieämbetets kulturarvsdata:

Just potentialen med er data är att den är konstant högaktuell, berör alla, och så lämplig för storytelling – något som är ganska kritiskt för att skapa engagemang och förståelse kring data. När det går att berätta en historia utifrån datan, sätta den i en kontext, blir den både begriplig och tillgänglig. Ni har beröringspunkter med så många områden där Hack for Sweden vill skapa en impact – historia, kultur, natur, byggnader, tillgänglighet, barn. Det går att knyta till allt och är därför väldigt ofta lämplig att använda!

I år kommer tävlingen att vara på Norrsken House i Stockholm, den 13-15 april. För att följa vad som händer både innan och under tävlingen kan man hitta inlägg i sociala medier under #hack4swe

Läs mer om vårt deltagande på Hack for Sweden 

 

Länkrika objekt i K-Samsök

Bilden http://kulturarvsdata.se/shm/media/html/14378
Ulf Bruxe SHM

Inom öppna-länkade-data–kretsar pratar man ofta om att det är länkarna mellan digitala objekt som ger värde, snarare än objekten i sig. Länkar sätter ett objekt i sitt sammanhang genom att beskriva hur det relaterar till andra objekt och begrepp. Länkar pekar åt andra ställen som beskriver objektet, och upplyser om andra kopplingar, resurser, och tankebanor. Har man någon gång snabbt slagit upp något på Wikipedia, bara för att inse några timmar senare att man har ägnat halva kvällen åt att följa intressanta länkar från sida till sida tills man hamnat på någon skum artikel som knappast har någonting med det man ville ursprungligen kolla upp att göra… då förstår man väl länkarnas kraft!

K-samsöksplattformen existerar för att förvalta, beskriva, och tillgängliggöra semantiska länkar mellan olika digitala objekt från fler än fyrtio olika minnesinstitutioner. Antalet länkar mellan objekt i K-samsök varierar ganska mycket. Vissa objekt i K-samsöks index har knappast några länkar alls, medan andra sitter mitt i ett rikt nätverk av länkar till hundratals – eller ibland tusentals – andra objekt. Men vilka objekt har flest länkar?

Det är tyvärr inte en enkel fråga att besvara med K-samsöks API:er (K-samsök, UGC-hubben) som inte riktigt stödjer sådana frågeställningar. Men det är en förhållandevis enkel fråga för SPARQL, frågespråket på den semantiska webben och RDF-resurser. Som tur är har vi kvar en triplestore databasserver från förra årets ArkHack i Umeå, som har ett SPARQL gränssnitt och innehåller en delmängd av K-samsöks data från Göteborgs stadsmuseum, Helsingborgs museer, Riksantikvarieämbetet, Svenskt hällristnings forsknings arkiv, Statens historiska museum, och delar av K-samsöks UGC-hubb. Trots att det bara är ett urval ur K-samsöks index, och att datan är snart ett år gammal, så borde detta ändå kunna ge en grov uppskattning om antalet länkar.

Tyvärr – igen – har maskinen med triplestoredatabasen ganska dålig prestanda nuförtiden (den skapades ju bara för ett tillfälligt hack) och klarade inte av att räkna ihop samtliga länkar för alla objekt. Det gick däremot att begränsa frågeställningen något och fråga om vilka objekt som har flest av en specifik sorts länk. I det här fallet valde jag avbildningar – vilka K-samsöksobjekt har flest bilder på sig? Enligt servern är K-samsöks fem-i-topp objekt med flest bilder:

  1. Ållebergskragen, med 160 bilder.
  2. Engelbrektskyrkan, med 136 bilder.
  3. Gamla Uppsala, med 128 bilder.
  4. Mönehalskragen, med 126 bilder.
  5. Ulrika Eleonora Kyrka, med 117 bilder.

Fint!

Men frågan om K-samsöks länkrikaste objekt behöver kanske ändå inte förbli obesvarad. För det finns nämligen ett litet antal kända objekt som har många gånger fler kopplingar till andra objekt än bara några hundra bilder. Sådana objekt har såpass många länkar att det inte går att visa samtliga på Kringla för att sidan skulle ta för lång att ladda. Ett sådant exempel är fornlämningen Bystan, Birka (Adelsö 119:1) som undersöktes 1990–1995 och har länkar till sina alla 106.786 fynd! Bara 89 visas i Kringla, men användare av K-samsöks API kan få ut en fullkomlig lista. Det kanske slår rekordet för K-samsöks länkrikaste objekt!

Ni kan bidra till att öka antalet länkar i K-samsök ni med, och därmed kvalitetshöja datan genom att lägga till länkar i vår UGC-hubb. Det är bara att logga in på Kringla.nu och skapa nya länkar mellan objekt, både inom K-samsök och på Wikipedia, Wikimedia, Libris, Platsr, samt Europeana!

Platsr på turné

Pojke som håller en skylt med texten "Go on creating"
Foto: fotologic (CC-by)

I slutet av maj var några av oss som jobbar med K-samsök, Kringla och Platsr ute på en turné i västra och södra Sverige. Vi besökte Stadsmuseet i Göteborg, Kulturen i Lund och Regionmuseet i Kristianstad. Vi ville presentera våra webbtjänster men framförallt utbyta tankar och diskutera kring utvecklingsfrågor gällande kulturarvsinformation, publik kommunikation och webb med personer som bland annat jobbar på minnesinstitutioner som museer och arkiv. Läs mer om turnén här.

För Platsrs del var mottagandet positivt och många av seminariedeltagarna kände spontant att de kunde tänka sig att använda Platsr som plattform för egenledda projekt och att de fann ett stort intresse och användarmöjlighet i Platsr som community. Vi var också noga med att framhålla att Platsr är tänkt som en community med personligt fokus med personliga berättelser knutna till en plats, och inte en sändarkanal för museer och andra institutioner.

Vi lyckades också hinna med ett användartest i Riksantikvarieämbetets lokaler i Visby i samband med en presentation av Platsr i slutet av samma vecka. Två representanter från Gotlands folkhögskola var här och fick en genomgång av Platsr samt testade den (nästan) färdigbyggda arkivsökskopplingen. De fick pröva att exportera ett arkivföremål från Kringla direkt till Platsr. Det funkade bra!

Maria Logothetis jobbar med Platsr på Riksantikvarieämbetet.

Kringla ger K-samsök ett ansikte

Ett pedagogiskt problem med K-samsök har sedan starten varit att förklara vad det är (och vad det inte är). Ordet ”sök” för ju tankarna till en söktjänst men så är det ju inte. K-samsök är motorn som servar applikationer/e-tjänster/tillämpningar (kärt barn har många namn) med data. Skulle man titta på datan i K-samsök i en webbläsare skulle det se ut såhär (en fritextsökning på ”runinskrifter”):

Strukturerat och fint men inte särskilt användarvänligt för den breda allmänheten. För att informationen ska gå att visa för slutanvändaren behövs det en applikation som anropar datan i K-samsök via dess öppna API. Nedan ser du en skärmdump av samma sökning i Kringla:

Lite intressantare och klart som korvspad? :)

>>Johan Carlström är projektledare för Kringla på Riksantikvarieämbetet.

Kringla, din sökväg till historien


Sökresultat i Kringla visad på kartan.

Nu gör vi en marknadsföringsinsats för att sprida vetskapen om Kringla existens. Detta kommer att göras via:

  • pressmeddelande
  • denna blogg
  • vår externa webbplats
  • diskussionsforum
  • gamla hederliga e-postlistor
  • Facebook, Twitter mm.
  • Fler förslag?

Inför utvecklingen av Kringla gjorde vi medvetet inga användarundersökningar, vi gjorde istället en omvärldskoll av hur andra har utvecklat sina söktjänster (bl a Europena, Victoria & Albert Museum och Brooklyn Museum) och utvecklade utifrån detta grundläggande sökfunktionalitet.

Tanken är nu att vi ska låta användarna testa Kringla och komma med feedback, detta kommer att göras genom  användartester men även via ett forum. Det går även att skicka e-post till kringla (at) raa.se men jag tycker att det blir intressantare om det görs öppet. Detta kommer sedan att ligga till grund för en utvecklingsomgång som är planerad till hösten.

Observera att Kringla ligger på två domännamn, Kringla.nu och Kringla.info. Själva sökapplikationen ligger på.nu och all kringinfo/sökhjälp/nyheter/mm ligger i en wordpressinstallation under kringla.info men integreras genom utseendet. Anledningen var att vi behövde ett enkelt sätt att uppdatera kringinfon. Detta var en nödlösning och tanken är att kunna slå ihop dem på sikt. Testa på och kom gärna med feedback!

>>Johan Carlström är projektledare för utvecklingen av Kringla