Taggad: statistik

Att söka bland kulturarv

Webbplatsen Kringla är ett gränssnitt mot K-samsök, en samsökningstjänst för kulturarv där du kan söka i samlingar hos mer än sextio svenska museer, arkiv och register. Under 2018 besöktes Kringla 256 010 gånger (i genomsnitt gjordes 701 besök per dag).  En stor del av besökarna hittade något av alla sju miljoner kulturarvsobjekt via Google och klickade sig sedan inte vidare på Kringla, men det var också många besökare som sökte i innehållet efter sådant de var intresserade av. Vad kan vi utläsa av webbstatistiken att användarna var intresserade av att hitta?

Skärmdump av Kringla

På Kringla finns det flera olika sätt att söka i samlingarna:

  • Fritextsökfältet högst upp där användaren kan skriva in egna sökord eller bara trycka på ”Sök” för att få upp alla objekt
  • Kartsökning (finns länkad under fritextfältet)
  • Detaljerad sökning med olika fasta fält (finns länkad under fritextfältet)
  • Fasta sökingångar på startsidan (kategorierna Föremål, Fotografier osv)

Utöver de olika sökvägarna kan användaren också filtrera sökresultatet på olika sätt på sökresultatsidan. Olika söksätt går förstås att kombinera, till exempel genom att fritextsöka och sedan avgränsa sökresultatet genom att trycka på de givna kategorierna på sökresultatsidan.

Fritextsökningar

Nästan 37 000 olika sökord användes under 2018 – det inkluderar dock olika kombinationer av söktermer samt stor/liten bokstav, till exempel räknas ”Malmö”, ”malmö” och ”malmö chokladfabrik” som tre olika söktermer, så i praktiken handlar det om färre ord.

De 50 vanligaste sökorden består framför allt av platsnamn och namn på ting eller företeelser, fördelat på ungefär hälften platsnamn och hälften övriga substantiv. Enstaka personnamn och företagsnamn förekommer också. Platsnamnen är till stor del småorter i Sverige (Matfors, Malung m fl), men även Grekland finns med bland de vanligaste söktermerna. Tingen som finns bland sökorden är blandade, allt från järnväg till ljusstöpningsform.

De tio vanligaste söktermerna 2018, återgivna som de skrevs in i sökfältet:

  1. same
  2. malmberget
  3. Nätra
  4. Malmö
  5. Carl Larsson
  6. streiff
  7. björkvril
  8. bommars
  9. Hablingbo Burge
  10. ankarede

Flera av dessa sökord fanns även med på topplistan 2017.

Kategori-sökningar

De övriga sätten att söka på har att göra med kategorier och andra fasta avgränsningar, till exempel vilken typ av objekt (byggnad, fotografi osv) det handlar om eller vilken minnesinstitution som ansvarar för objektet. Användningen av dessa kategorier är svår att överblicka, men hur många gånger sökresultat som använder en viss filtrering har visats kan ge en fingervisning om hur de används. Antalet sidvisningar är antalet gånger sidor har laddats och säger inget om hur många användare det rör sig om eller hur många söktermer som har kombinerats i samma sökning. Siffrorna säger alltså mer om förhållandet mellan olika typer av kategoriseringar än om hur många sökningar som görs.

Diagrammet nedan visar antalet visningar av sökresultatsidor som använder någon av de fasta kategorier i K-samsök som finns som sök- eller filtreringsmöjlighet i Kringla. Kategorier som har med geografi att göra har här slagits ihop till ”Geografisk avgränsning”, tidskategorier är sammanslagna till ”Avgränsning i tid” och ”Övrig metadata” omfattar sökfält/filtreringar som har använts väldigt lite under året (till exempel ID-nummer).

Stapeldiagram: Antalet sidvisningar för olika sökavgränsningar i Kringla 2018. Typ av objekt är klart vanligast, därefter följer Geografisk avgränsning, Förvaltande organisation, Avgränsning i tid, Rättigheter för innehållet, Ämne samt Övrig metadata.

Typ av objekt (fotografier, föremål, kulturlämningar osv) är den klart vanligaste avgränsningen i sökresultaten. Det är en väl synlig kategori på Kringla: flera av objektstyperna finns som fasta sökingångar på startsidan, det är också den kategori som ligger högst upp bland filtreringsalternativen på sökresultatsidan och den finns dessutom med under detaljerat sök. Även med det i åtanke är det stor skillnad mellan hur ofta typ av objekt används som avgränsning jämfört med övriga kategorier. Den typ av avgränsning som används näst mest – den geografiska som utgörs av flera olika fält och kategorier (inklusive kartsök) – når inte ens upp till en fjärdedel av sidvisningarna för objektstyperna.

Det är också klart vanligare att avgränsa söket geografiskt än att göra tidsavgränsningar. Här verkar det vara vanligare att filtrera sökresultatet enligt landskap än att använda kartsökningen, men landskaps-kategorin är troligen också mer synlig för de flesta användare än vad kartsöksmöjligheten är. Även bland fritextsökningarna är platser vanliga, se ovan.

”Rättigheter för innehållet” har att göra med hur bilder och annan media får användas, och eftersom fria licenser (Public Domain Mark, CC BY) är vanligast bland de sökresultaten rör det sig sannolikt ofta om besökare som vill hitta bilder de kan använda sig av.

I stapeln ”Typ av objekt” gömmer sig så klart många olika objektstyper eftersom innehållet i K-samsök är väldigt varierat. Men det är tydligt att sökningar bland fotografier är klart mest populärt, medan vissa typer av objekt knappt aktivt sökts fram alls:

Stapeldiagram: Antal sidvisningar för sökresultat för olika typer av objekt. Fotografier har den högsta stapeln. Kategorierna Föremål, Byggnad, Kulturlämning, Dokument, Person, Karta, Konstverk, Ritning, Bok, Kulturmiljö och Film/Video följer i en snabbt fallande mängd. Övriga objekttyper i Kringla används väldigt lite i sökningar.

Antalet sidvisningar för sökresultat som är avgränsade till fotografier utgör faktiskt en åttondel av alla sidvisningar på Kringla 2018! I jämförelse med övriga typer av kategorier har dock även objektstyperna Föremål, Byggnad och Kulturlämning relativt stor användning.

Sökstatistiken speglar inte riktigt fördelningen av innehållet i K-samsök/Kringla — den största kategorin där är föremål (3 miljoner objekt i skrivande stund), följt av fotografier (2 miljoner objekt), kulturlämningar (1 miljoner objekt) och dokument (500 000 objekt).

Sammanfattningsvis

En stor del av sökningarna i Kringla handlar om bilder eller om objekt kopplade till en viss geografisk plats — säkert ofta i kombination. Det finns också tydligt både användare som söker efter något specifikt (till exempel ”dosspänne”) och användare som hellre vill se allt som finns inom en viss kategori (till exempel alla objekt som har med Anundsjö att göra). Bland sju miljoner objekt från över sextio olika källor finns goda möjligheter att hitta det man söker, men också en stor utmaning i att hitta rätt i ett innehåll som har så skiftande karaktär.

Länkrika objekt i K-Samsök

Bilden http://kulturarvsdata.se/shm/media/html/14378
Ulf Bruxe SHM

Inom öppna-länkade-data–kretsar pratar man ofta om att det är länkarna mellan digitala objekt som ger värde, snarare än objekten i sig. Länkar sätter ett objekt i sitt sammanhang genom att beskriva hur det relaterar till andra objekt och begrepp. Länkar pekar åt andra ställen som beskriver objektet, och upplyser om andra kopplingar, resurser, och tankebanor. Har man någon gång snabbt slagit upp något på Wikipedia, bara för att inse några timmar senare att man har ägnat halva kvällen åt att följa intressanta länkar från sida till sida tills man hamnat på någon skum artikel som knappast har någonting med det man ville ursprungligen kolla upp att göra… då förstår man väl länkarnas kraft!

K-samsöksplattformen existerar för att förvalta, beskriva, och tillgängliggöra semantiska länkar mellan olika digitala objekt från fler än fyrtio olika minnesinstitutioner. Antalet länkar mellan objekt i K-samsök varierar ganska mycket. Vissa objekt i K-samsöks index har knappast några länkar alls, medan andra sitter mitt i ett rikt nätverk av länkar till hundratals – eller ibland tusentals – andra objekt. Men vilka objekt har flest länkar?

Det är tyvärr inte en enkel fråga att besvara med K-samsöks API:er (K-samsök, UGC-hubben) som inte riktigt stödjer sådana frågeställningar. Men det är en förhållandevis enkel fråga för SPARQL, frågespråket på den semantiska webben och RDF-resurser. Som tur är har vi kvar en triplestore databasserver från förra årets ArkHack i Umeå, som har ett SPARQL gränssnitt och innehåller en delmängd av K-samsöks data från Göteborgs stadsmuseum, Helsingborgs museer, Riksantikvarieämbetet, Svenskt hällristnings forsknings arkiv, Statens historiska museum, och delar av K-samsöks UGC-hubb. Trots att det bara är ett urval ur K-samsöks index, och att datan är snart ett år gammal, så borde detta ändå kunna ge en grov uppskattning om antalet länkar.

Tyvärr – igen – har maskinen med triplestoredatabasen ganska dålig prestanda nuförtiden (den skapades ju bara för ett tillfälligt hack) och klarade inte av att räkna ihop samtliga länkar för alla objekt. Det gick däremot att begränsa frågeställningen något och fråga om vilka objekt som har flest av en specifik sorts länk. I det här fallet valde jag avbildningar – vilka K-samsöksobjekt har flest bilder på sig? Enligt servern är K-samsöks fem-i-topp objekt med flest bilder:

  1. Ållebergskragen, med 160 bilder.
  2. Engelbrektskyrkan, med 136 bilder.
  3. Gamla Uppsala, med 128 bilder.
  4. Mönehalskragen, med 126 bilder.
  5. Ulrika Eleonora Kyrka, med 117 bilder.

Fint!

Men frågan om K-samsöks länkrikaste objekt behöver kanske ändå inte förbli obesvarad. För det finns nämligen ett litet antal kända objekt som har många gånger fler kopplingar till andra objekt än bara några hundra bilder. Sådana objekt har såpass många länkar att det inte går att visa samtliga på Kringla för att sidan skulle ta för lång att ladda. Ett sådant exempel är fornlämningen Bystan, Birka (Adelsö 119:1) som undersöktes 1990–1995 och har länkar till sina alla 106.786 fynd! Bara 89 visas i Kringla, men användare av K-samsöks API kan få ut en fullkomlig lista. Det kanske slår rekordet för K-samsöks länkrikaste objekt!

Ni kan bidra till att öka antalet länkar i K-samsök ni med, och därmed kvalitetshöja datan genom att lägga till länkar i vår UGC-hubb. Det är bara att logga in på Kringla.nu och skapa nya länkar mellan objekt, både inom K-samsök och på Wikipedia, Wikimedia, Libris, Platsr, samt Europeana!

Hur användes Kringla under 2014?

Det mest besökta objektet i Kringla 2014: en samisk bandvävsked som finns på Världskulturmuseet. (Bildlicens: CC BY-NC-ND) Klicka på bilden för att komma till objektet.
Det mest besökta objektet i Kringla 2014: en samisk bandvävsked som finns på Världskulturmuseet. (Bildlicens: CC BY-NC-ND) Klicka på bilden för att komma till objektet.

Webbplatsen Kringla är ett gränssnitt mot K-samsök, en samsökningstjänst för kulturarv där du kan söka i samlingarna hos närmare femtio svenska museer, arkiv och register. Här är några exempel på hur söktjänsten användes 2014:

De populäraste kategorierna att söka efter 2014 var fotografier, byggnader och föremål. Många av Kringlas användare använder dock fritextsökrutan för att hitta det de letar efter. Av de femtio vanligaste sökorden på Kringla 2014 är mer än hälften namn på platser — här finns en karta över de platser som finns med på 50-i-topplistan (minus några sockennamn som inte gick att placera ut på kartan).

Föremål var också vanliga sökord. De tio vanligaste föremålen som användare sökte efter 2014:

1. skrin (508 sökningar)
2. torshammare (236 sökningar)
3. vävstol (219 sökningar)
4. porslin kina (201 sökningar)
5. fingerring (150 sökningar)
6. träsnitt (105 sökningar)
7. slända (100 sökningar)
8. mask (97 sökningar)
9. sländtrissa (91 sökningar)
10. yxa (87 sökningar)

Två stora kategorier av besökare hade lite olika beteende på webbplatsen: de som hittar till Kringla genom sociala medier och de som hittar dit genom en länk från någon kulturarvsrelaterad webbplats. Två exempel på webbplatser som många besökare kommer från är Pinterest och Sockenbilder. Sockenbilder har bidragit med ungefär hälften så många besök till Kringla som Pinterest har gjort:

Antal besök från Pinterest jämfört med Sockenbilder. (Bildlicens: CC BY)
Antal besök från Pinterest jämfört med Sockenbilder. (Bildlicens: CC BY)

Men å andra sidan tillbringar besökarna från Sockenbilder i genomsnitt mycket längre tid på Kringla:

Tid tillbringad på Kringla för besök från Pinterest jämfört med Sockenbilder. (Bildlicens: CC BY)
Genomsnittlig tid på Kringla för besök från Pinterest jämfört med Sockenbilder. (Bildlicens: CC BY)

Sockenbilderbesökarna besöker också i genomsnitt fler än tio gånger så många sidor på Kringla än vad besökarna från Pinterest gör. Den här skillnaden mellan korta och mer ingående besök är genomgående för skillnaden mellan besök från snabba sociala medier och besök från traditionella webbplatser.

Besökarna från Pinterest har förstås också sett och interagerat med innehåll från Kringla på Pinterest — här kan du se vilka bilder som har delats av användare där. Innehåll från Kringla delas också relativt mycket på Facebook, till exempel genom en kampanj där bilder lades ut på Riksantikvarieämbetets sida på Facebook och i genomsnitt nådde 2700 personer per inlägg. Att så många av bilderna i Kringla är fria att använda gör att de lättare kan spridas och nå de människor som inte besöker Kringla eller minnesinstitutionernas egna söktjänster.

Sammanlagt hade Kringla 166 432 besök under 2014, vilket ger 456 besök per dag i genomsnitt. Tyvärr var det få av besökarna som svarade på den enkät som var publicerad på webbplatsen under hösten, men de svar som kom in antyder att många som använder Kringla gör det i tjänsten.

Internet och svenskarna 2012

Idag släpptes rapporten Internet och svenskarna 2012. Den är fylld med statistik om hur vi använder internet i Sverige. Jag har försökt sammanfatta och plocka ur några av de mest intressanta siffrorna som har påverkan på vårt webbarbete i framtiden.

Användning av internet

1995 var det 2% av svenskarna som använde internet. 2012 är den siffran 89%.

Det är en hög siffra, även internationellt sett, men man får inte glömma att det fortfarande är 1,2 miljoner svenskar som inte använder internet. Av de som inte använder nätet uppger ca 2/3 att de inte är intresserade av det.

I åldersgruppen 12-45 år är 90% dagliga användare av internet. 74% har tillgång till bärbar dator. 55% har internet i mobilen. För två år sedan hade bara 16% internet i mobilen.

En intressant siffra är att det bara är 0,5% som endast har tillgång till internet via mobil eller surfplatta.

Av internetanvändarna

62% använder epost dagligen. 64% besöker sociala nätverk någon gång. 66% lyssnar på musik någon gång (25% gör det dagligen).

Runt 80% av internetanvändarna handlar, bokar resar och betalar räkningar på internet någon gång.

Sociala nätverk

I åldersgruppen 13-25 år besöker 90% sociala nätverk någon gång.

En tredjedel av de som har Facebook-konto gör aldrig en statusuppdatering.

30% av de som har internet i mobilen checkar in, eller på annat sätt geotaggar, på sociala nätverk.

Barn och unga

1997 använde hälften av 15-åringarna internet. De senaste två åren är det hälften av treåringarna som använder internet någon gång. 40% av tvååringarna gör det.

Användandet av mobiler och surfplattor är utbrett bland barnen. Hälften av 9-10-åringarna har tillgång till internet i mobilen.

Mobilt

Av befolkningen som är över 12 år, använder 54% mobilt internet. I gruppen 12-35 år är siffran 83% (65% dagligen).

20% av befolkningen (+12) har tillgång till surfplatta. För två år sedan var det bara 2%. Intressant att jämföra med USA, där 25% av befolkningen har surfplatta.

Sammanfattning

Ökningen av tillgången till internet har mer eller mindre planat ut, men det mobila användandet har ökat kraftigt de senaste två åren.

Tiden som spenderas på nätet ligger däremot hyfsat still, utom i de yngre åldersgrupperna, där ökar den.

Läs gärna igenom hela rapporten, det finns mycket intressant att ta fasta på där.

Statistik för första halvåret 2012

Här kommer lite mer tråkig statistik. Eller, så tråkig är den inte, för det är många plus-tecken.

Jag har kollat siffrorna för 1 januari – 30 juni 2012, och jämfört med samma tid 2011. Jag har bara kollat www.raa.se.

Anledningen till att vi kollar lite extra nog är för att vi ska kunna mäta lite mot den nya webbplatsen senare.

Antal besök: 281 926 (+21,3%)
Unika besök: +28,3%
Sidvisningar: +17,4% (829 220)

Mobila besök: +295%
Andel mobila besök: 8,3% (2011: 2,5%)
(Tänk på att juli 2012 inte är med, då det var 25% mobila besök.)

Trafikkällor
Google: 50%
Facebook: 4212 besök (2011: 1971) +113%

Sökord (utvalda)
Riksantikvarieämbetet: +21%
Glimmingehus: +86%

Populära sidor
Startsidan: 16% av alla sidvisningar
Lediga jobb: 2,4%
Glimmingehus: 2% (+55%, totalt 16 611 sidvisningar på den startsidan)

OBS! Den här sidan kommer från en utvecklingsblogg vi satte upp inför bytet av CMS på Riksantikvarieämbetet. 

Lite statistik för juli 2012

Eftersom det är 1 augusti idag och det var väldigt längesedan jag gjorde en sammanfattning så kommer den här. Så fort jag rett ut vad det är för fel på Google Analytics så kommer en sammanställning för första halvåret också.

Jag kollar mest på andelar och förändringar, då det faktiskt är mest intressant.

Alla siffror gäller alltså juli 2012 och är jämförda med juli 2011. Om inte annat anges.

www.raa.se

Antal besök 51 340 (+7%)
Unika besök +3,8%
Sidvisningar +1,5%

Glädjande med en så pass stor ökning. Längre ner i statistiken kommer det att visas var den kommer ifrån.

Trafikkällor

Google står för 57% av trafiken. Sedan är det mer utspritt.

Sökord (andel)

Glimmingehus 21,5%
Riksantikvarieämbetet 5%
Birka 4,5% (ner från 9% 2011)
Ale stenar 3,4% (inkl stavningsvarianter)
Gamla Uppsala (inkl museum) 2,8%

Alla siffror är som förra året, förutom Birka som har minskat kraftigt. En förklaring till Birkas minskning är att Strömmas sidor nu har börjat ranka över våra. Vilket är som det ska vara.

Mest populära sidor

Startsidan +7,8%
Glimmingehus +19%
Birka -23,6%
Gamla Uppsala +7%

Glimmingehus undersidor är även de upp med +10 till +18% jämfört med 2011.

Mobila enheter

Det är intressant att studera mobilsurfandet, eftersom det är mycket större på sommaren. Det har även ökat kraftigt jämfört med förra sommaren. +123%. Andelen mobila besök är 25% vilket är en fördubbling mot 2011.

Operativsystem (antal besök, andel av mobilbesöken, jämfört med 2011)

iOS (iPad, iPhone, iPod) 9442 besök, andel 73%, +213% mot 2011
Android 3358 besök, andel 26%, +165%
Windows phone 73 besök

Tillverkare (andel)

Apple 73%
Samsung 8,4%
SonyEricsson 7,6%
HTC 4,3%

Här kan man fundera lite på varför Apple har så stor andel av besöken, trots att det finns många fler Android och Samsung-telefoner.

Mer teknik

När det gäller webbläsare minskar användandet av Internet Explorer med 14%, medan Safari ökar med 59%. Men i den siffran ingår mobila Safari på till exempel iPhone och iPad.

Operativsystem så minskar Windows med 10% (andel 64%) och iOS är numer näst störst med en andel på 18%.

Facebook

Vi har nu 2808 gillare på vår sida. Stort engagemang och inläggen visas för en stor andel av gillarna, trots att Facebook numer tar betalt för att visa inlägget oftare. Vi har inte betalat något.

Twitter

1106 följare och det ökar stadigt.

Youtube

I juli visades våra klipp 860 gånger. Mest visades filmen om Platsr (204 visningar), panelsamtalet från Öppna kulturarvet (se nedan) och Michael Edsons föredrag från samma event.

Totalt har våra klipp visats 9125 gånger. UVs filmer räknas inte med i detta. I topp ligger Platsr-filmen med 798 visningar, trots att den bara funnits ute ett par månader.

Bambuser

Sändningen från Öppna kulturarvet har visats 293 gånger varav 128 såg det live. Mycket bra siffra.

Flickr

Riksantikvarieämbetets vanliga Flickr-konto hade på Öppna kulturarvet-bilderna 291 visningar.

Flickr Commons visades bilderna 50 780 gånger under juli, trots allt trubbel vi har haft med att få betala. Men nu är det löst och artikeln på BuzzFeed ser säkert till att dra upp statistiken lite.

Öppnakulturarvet.se

Inför eventet Öppna kulturarvet på Almedalsveckan sattes en enkel kampanjwebbplats upp. Över 1000 besök fick den.

Det intressanta är att 24% kom från Facebook, 12% från Twitter. Det är även intressant att se att 19% av besöken var från mobila enheter.

Sammanfattning

Kul med en allmän ökning och det mesta av ökningen står absolut Glimmingehus för. Det ska bli intressant att stämma av det med deras besöksstatistik för att se om de följer varandra.

Det mobila surfandet har ökat kraftigt och det kommer det att fortsätta att göra. Det visar om inte annat att vi gjorde rätt när vi valde en responsiv webbplats.

Foto: Berit Wallenberg, 1920. (No copyright)

OBS! Den här sidan kommer från en utvecklingsblogg vi satte upp inför bytet av CMS på Riksantikvarieämbetet. 

200 000 visningar på Flickr!

Jag har ”Flickr Commons-vakten” den här veckan.  Och noterade att natten mellan söndag och måndag visades våra bilder på The Commons för den 200 000:e gången. Kanske undrar du vilka som varit mest populära och då kan jag av en händelse visa just det här och nu.

Den blåa Stockholmsbilden har visats 7 805 gånger och är den i särklass mest populära bilden. Fiskaren och Flöjtspelaren har visats 3 600 respektive 2 700 gånger.

Berättande bilder, miljöer med mänsklig närvaro, stämningar och porträtt är populära bilder.  Förvånande? Nej, knappast.