Kategori: Statistik

Att söka bland kulturarv

Webbplatsen Kringla är ett gränssnitt mot K-samsök, en samsökningstjänst för kulturarv där du kan söka i samlingar hos mer än sextio svenska museer, arkiv och register. Under 2018 besöktes Kringla 256 010 gånger (i genomsnitt gjordes 701 besök per dag).  En stor del av besökarna hittade något av alla sju miljoner kulturarvsobjekt via Google och klickade sig sedan inte vidare på Kringla, men det var också många besökare som sökte i innehållet efter sådant de var intresserade av. Vad kan vi utläsa av webbstatistiken att användarna var intresserade av att hitta?

Skärmdump av Kringla

På Kringla finns det flera olika sätt att söka i samlingarna:

  • Fritextsökfältet högst upp där användaren kan skriva in egna sökord eller bara trycka på ”Sök” för att få upp alla objekt
  • Kartsökning (finns länkad under fritextfältet)
  • Detaljerad sökning med olika fasta fält (finns länkad under fritextfältet)
  • Fasta sökingångar på startsidan (kategorierna Föremål, Fotografier osv)

Utöver de olika sökvägarna kan användaren också filtrera sökresultatet på olika sätt på sökresultatsidan. Olika söksätt går förstås att kombinera, till exempel genom att fritextsöka och sedan avgränsa sökresultatet genom att trycka på de givna kategorierna på sökresultatsidan.

Fritextsökningar

Nästan 37 000 olika sökord användes under 2018 – det inkluderar dock olika kombinationer av söktermer samt stor/liten bokstav, till exempel räknas ”Malmö”, ”malmö” och ”malmö chokladfabrik” som tre olika söktermer, så i praktiken handlar det om färre ord.

De 50 vanligaste sökorden består framför allt av platsnamn och namn på ting eller företeelser, fördelat på ungefär hälften platsnamn och hälften övriga substantiv. Enstaka personnamn och företagsnamn förekommer också. Platsnamnen är till stor del småorter i Sverige (Matfors, Malung m fl), men även Grekland finns med bland de vanligaste söktermerna. Tingen som finns bland sökorden är blandade, allt från järnväg till ljusstöpningsform.

De tio vanligaste söktermerna 2018, återgivna som de skrevs in i sökfältet:

  1. same
  2. malmberget
  3. Nätra
  4. Malmö
  5. Carl Larsson
  6. streiff
  7. björkvril
  8. bommars
  9. Hablingbo Burge
  10. ankarede

Flera av dessa sökord fanns även med på topplistan 2017.

Kategori-sökningar

De övriga sätten att söka på har att göra med kategorier och andra fasta avgränsningar, till exempel vilken typ av objekt (byggnad, fotografi osv) det handlar om eller vilken minnesinstitution som ansvarar för objektet. Användningen av dessa kategorier är svår att överblicka, men hur många gånger sökresultat som använder en viss filtrering har visats kan ge en fingervisning om hur de används. Antalet sidvisningar är antalet gånger sidor har laddats och säger inget om hur många användare det rör sig om eller hur många söktermer som har kombinerats i samma sökning. Siffrorna säger alltså mer om förhållandet mellan olika typer av kategoriseringar än om hur många sökningar som görs.

Diagrammet nedan visar antalet visningar av sökresultatsidor som använder någon av de fasta kategorier i K-samsök som finns som sök- eller filtreringsmöjlighet i Kringla. Kategorier som har med geografi att göra har här slagits ihop till ”Geografisk avgränsning”, tidskategorier är sammanslagna till ”Avgränsning i tid” och ”Övrig metadata” omfattar sökfält/filtreringar som har använts väldigt lite under året (till exempel ID-nummer).

Stapeldiagram: Antalet sidvisningar för olika sökavgränsningar i Kringla 2018. Typ av objekt är klart vanligast, därefter följer Geografisk avgränsning, Förvaltande organisation, Avgränsning i tid, Rättigheter för innehållet, Ämne samt Övrig metadata.

Typ av objekt (fotografier, föremål, kulturlämningar osv) är den klart vanligaste avgränsningen i sökresultaten. Det är en väl synlig kategori på Kringla: flera av objektstyperna finns som fasta sökingångar på startsidan, det är också den kategori som ligger högst upp bland filtreringsalternativen på sökresultatsidan och den finns dessutom med under detaljerat sök. Även med det i åtanke är det stor skillnad mellan hur ofta typ av objekt används som avgränsning jämfört med övriga kategorier. Den typ av avgränsning som används näst mest – den geografiska som utgörs av flera olika fält och kategorier (inklusive kartsök) – når inte ens upp till en fjärdedel av sidvisningarna för objektstyperna.

Det är också klart vanligare att avgränsa söket geografiskt än att göra tidsavgränsningar. Här verkar det vara vanligare att filtrera sökresultatet enligt landskap än att använda kartsökningen, men landskaps-kategorin är troligen också mer synlig för de flesta användare än vad kartsöksmöjligheten är. Även bland fritextsökningarna är platser vanliga, se ovan.

”Rättigheter för innehållet” har att göra med hur bilder och annan media får användas, och eftersom fria licenser (Public Domain Mark, CC BY) är vanligast bland de sökresultaten rör det sig sannolikt ofta om besökare som vill hitta bilder de kan använda sig av.

I stapeln ”Typ av objekt” gömmer sig så klart många olika objektstyper eftersom innehållet i K-samsök är väldigt varierat. Men det är tydligt att sökningar bland fotografier är klart mest populärt, medan vissa typer av objekt knappt aktivt sökts fram alls:

Stapeldiagram: Antal sidvisningar för sökresultat för olika typer av objekt. Fotografier har den högsta stapeln. Kategorierna Föremål, Byggnad, Kulturlämning, Dokument, Person, Karta, Konstverk, Ritning, Bok, Kulturmiljö och Film/Video följer i en snabbt fallande mängd. Övriga objekttyper i Kringla används väldigt lite i sökningar.

Antalet sidvisningar för sökresultat som är avgränsade till fotografier utgör faktiskt en åttondel av alla sidvisningar på Kringla 2018! I jämförelse med övriga typer av kategorier har dock även objektstyperna Föremål, Byggnad och Kulturlämning relativt stor användning.

Sökstatistiken speglar inte riktigt fördelningen av innehållet i K-samsök/Kringla — den största kategorin där är föremål (3 miljoner objekt i skrivande stund), följt av fotografier (2 miljoner objekt), kulturlämningar (1 miljoner objekt) och dokument (500 000 objekt).

Sammanfattningsvis

En stor del av sökningarna i Kringla handlar om bilder eller om objekt kopplade till en viss geografisk plats — säkert ofta i kombination. Det finns också tydligt både användare som söker efter något specifikt (till exempel ”dosspänne”) och användare som hellre vill se allt som finns inom en viss kategori (till exempel alla objekt som har med Anundsjö att göra). Bland sju miljoner objekt från över sextio olika källor finns goda möjligheter att hitta det man söker, men också en stor utmaning i att hitta rätt i ett innehåll som har så skiftande karaktär.

K-samsök 2013

Under 2013 skördade vi drygt 1 miljon nya objekt till K-samsök och ca 1,1 miljoner objekt ändrades (och skördades därmed om) vilket ger ett totalt antal på 5,35 miljoner objekt från 40 institutioner och 22 hembygdsföreningar vid årsskiftet.

Diagram över ökningen av antalet institutioner som går att skilja ut som separata datamängder
Diagram över ökningen av antalet institutioner som går att skilja ut som separata datamängder.

Under 2012 och i början av 2013 jobbade vi med att revidera det avtal/den överenskommelse som Riksantikvarieämbetet skriver med dem som levererar data till K-samsök. Tyvärr drog arbetet med avtalet ut på tiden och för att inte behöva skicka ut avtalet fler gånger bromsade vi uppskördningen av nya institutioner. När det nya avtalet skickades ut i april kunde vi åter skörda nya institutioner, totalt under året skördades data från 16 nya institutioner. Dessa var:

  • Aeroseum
  • Ajtte, Svenskt Fjäll- och Samemuseum
  • Enköpings museum
  • Försvarsmuseum Boden
  • Gotlands försvarsmuseum
  • Göteborgs stadsmuseum
  • Hemsö fästning
  • Karlsborgs fästningsmuseum
  • Kulturmagasinet, Helsingborgs museer
  • Malmö museer
  • Miliseum
  • Postmuseum
  • Skansen
  • Teknikland
  • Teleseum
  • The Unstraight Museum

Majoriteten av dessa använde ett system som redan kan leverera data till K-samsök, i dessa fall Carlotta och Primus. Undantaget är The Unstraight Museum som använder Collecive Access.

En intressant jämförelse är att jämföra antalet institutioner i K-samsök med det totala antalet museer m.fl. i Sverige. Vi utgick ifrån Riksförbundet Sveriges museers (RSM) lista över svenska museer och gjorde några tillägg från en rapport från Myndigheten för kulturanalys samt la till institutioner som levererar till K-samsök men som inte är ett museum (t ex Riksantikvarieämbetet). Till detta tillkommer 1445 arbetslivsmuseer (varav några även finns med i RSMs lista). Vår lista landade på 284 institutioner.

Av dessa levererar 14,1% till K-samsök. Detta innebär dock inte att det endast är 14,1% av den totala mängden kutlurarvsdata som är skördad, den siffran är troligtvis högre då flera av de stora centralmuseerna och Riksantikvarieämbetet redan levererar data. Den exakta siffran är dock svår att uppskatta.

Antalet länsmuseer (utifrån Länsmuseernas samarbetsråds lista) som levererar data är 17,4%. Antalet centralmuseer som levererar är 57,7%. Så även om antalet objekt och institutioner har ökat under året så finns det fortfarande mycket att göra. Flera institutioner har dock inga digitala samlingar eller har egna lösningar eller andra lösningar som idag inte kan skördas till K-samsök. Värt att betänka är att många institutioner använder systemet SOFIE som idag inte kan leverera data till K-samsök. Det är dock vår förhoppning att detta ska bli möjligt under 2014 och då finns det potentiellt 250 institutioner och föreningar varav tiotalet länsmuseer att skörda. Totalt handlar det om 3,5 milj objekt!

Under året gjorde vi en omskördning av data från K-samsök till Europeana enligt deras nya datamodell, EDM (Europeana Data Model). Då Europeana kräver att media som beskrivs ska vara uppmärkt enligt deras rättighetsmodell valde vi att endast leverera objekt med en korrekt licens. Detta innebär att det totala antalet objekt från K-samsök är (1,151,627 den 8 jan, då finns en del objekt utan licens kvar som inte rensats bort än) vilket är ca 100 000 objekt färre än vid förra årsskiftet. Dock levereras mer metadata och det framgår tydligt hur bilder mm får återanvändas. Utöver detta levereras drygt 812 000 objekt från FMIS via Carare. Vi kommer att jobba vidare med detta under 2014 för att kunna leverera så mycket som möjligt av innehållet i K-samsök till Europeana.

Under 2013 översattes även K-samsöks schema och resurser till OWL (Web Ontology Language) samt fick stöd för att ge svar på API-anrop i JSON-LD-format.

 

På gång under 2014
Utöver löpande förvaltning kommer vi att göra en översyn över systemförvaltningen på Riksantikvarieämbetet för att kunna uppnå en mer effektiv förvaltning med hög kvalitet. Vi bedömer att detta inte kommer att påverka support till API-användare och institutioner.

Något som har släpat efter i backlogen är möjligheten att få ut ordentlig statistik gällande användningen av API:et. Under början av 2014 kommer vi att jobba med detta och tanken är att denna statisk ska nås även publikt, åtminstone på sikt.

Vi kommer att fortsätta att testa SPARQL/Triple store för att möjliggöra mer avancerade sökningar. Vi kommer även att utreda hur man bästa kan leverera standardformat till K-samsök (t ex Lido).

Vi håller just nu på att planera för årets K-samsöksmöten. Vårens möte äger preliminärt rum i Göteborg den 25 mars samt i Visby i början av september. Mer info kommer.

>>Johan Carlström – systemansvarig för K-samsök