Kategori: Länkade öppna data

Strategier för samlingar på nätet

Fullsatt i Oslo 20 april
Fullsatt seminarium på Nasjonalmuseet i Oslo den 20 april 2018. Foto: Børre Høstland / Nasjonalmuseet, CC-BY 4.0.

Hur visar museerna upp sina samlingar på nätet och hur kan vi lära av varandra? Dessa frågor är aktuella inte bara i Sverige utan även i Norge. Aron Ambrosiani vid Nordiska museet besökte Nasjonalmuseet i Oslo i april för ett endagsseminarium om samlingar på nätet och webbteknologiska strategier med ett femtiotal deltagare från norska museer, arkiv och bibliotek. Här kommer några nedslag från vad som diskuterades under dagen.

Skärmdump av Vy.nasjonalmuseet.no, Nasjonalmuseets maskingenererade gruppering av konstverk utifrån stil och motiv.

Gro Benedikte Pedersen och Magnus Bognerud arbetar på sektionen för digital samlingsförvaltning vid Nasjonalmuseet. De berättade om arbetet med standardiserade terminologier för att beskriva konstverk. Resultatet är en uppdatering av Feltkatalogen med matchning mot vokabulären Getty Art & Architecture Thesaurus. Allt tillgängligt som länkade öppna data i norsksvenska plattformen Kulturnav. Nasjonalmuseet kommer att använda terminologierna när de förbereder utställningarna i det nya museibygget på Vestbanen enligt principen COPE (create once, publish everywhere).

Experimentella visualiseringar

Nasjonalmuseet har även gjort några experimentella visualiseringar av samlingen tillsammans med konsultfirman Bengler. Dels utifrån konstnärerna, dels konstverken. Konstverken analyserades med hjälp av maskininlärning som identifierade likheter i motiv och stil. Ett delmål var att utforska möjligheterna att mappa befintliga motivbibliotek mot vokabulären Iconclass. Detta visade sig vara svårt eftersom hierarkierna i Iconclass inte är grupperade visuellt utan tematiskt. Till exempel sorterar hundar under människor (människans bästa vän ni vet) medan rävar sorterar under natur. En del termer kunde ändå matchas mot resultatet av maskininlärningen.

Egen samlingssajt

Dag Hensten berättade kort om samling.nasjonalmuseet.no. Varför har Nasjonalmuseet en egen samlingssajt utöver Digitalt museum? Kort svar: för att publiken förväntar sig det. Samlingssidorna på den egna webbplatsen besöks betydligt oftare än motsvarande sidor på Digitalt museum.

Samlingssajten hämtar bild och metadata från Digitalt museum genom dess API men kompletterar med andra datakällor, till exempel Norsk kunsterleksikon och Wikipedia. Navigering mellan liknande konstverk erbjuds genom maskininlärningsexperimentet ovan.

Fotosamlingar

Anette Alsvik (fotoantikvarie) och Lars Jynge Alvik (utvecklare) redogjorde för det norska Riksarkivets digitaliserade fotosamlingar. Dessa webbpubliceras genom det norska DAM-systemet Fotoware. Genom Fotowares API har ett tiotusental bilder även publicerats på Wikimedia Commons.

Cirka 600 bilder används på ca 800 wikipediasidor vilka har en miljon sidvisningar i månaden på ett trettiotal språkversioner. Riksarkivet använder det norska fotografregistret för att hålla reda på fotograferna.

Kopplingar till Kulturnav

Skannad skadedokumentation från Vestfoldmuseenes arkiv. Utslocknad upphovsrätt

Både Kristin Halaas (Vestfoldmuseene) och Alexander Lindbäck (Norsk folkemuseum/Norsk maritimt museum) berättade om sina museers arbete i Kulturnav. Vestfoldmuseene experimenterar bland annat med hur deras fartygsmålningar kan använda länkade öppna data och använder till exempel ett register över segelfartyg som Norsk maritimt museum importerat till Kulturnav. En stor del av arbetet handlar om att ersätta befintlig information i fritextfält med kopplingar till Kulturnav.

Med hjälp av frivilliga i föreningen Slekt og Data har Vestfoldmuseene dessutom digitaliserat cirka 20 000 dokument från arkivet för Østlandske Skipsassuranceforening. De inskannade haverirapporterna finns tillgängliga på disnorge.no medan arkivförteckningen finns i Asta/Arkivportalen.

Skriptad kopiering till Wikimedia Commons

Femtiotalsklänningar ur Nordiska museets föremålssamling. Visas i utställningen Mitt 50-tal. Foto: Elisabeth Eriksson / Nordiska museet, CC-BY 4.0.

Aron Ambrosiani (Nordiska museet) berättade om museets satsning på Wikipedia och Wikimedia Commons. Tillsammans med Wikimedia Sverige har museet anpassat och vidareutvecklat ett skript för kopiering av bilder och metadata från Digitalt museum till Wikimedia Commons. I april laddade museet upp ett hundratal mode- och föremålsbilder kopplade till utställningen Mitt 50-tal.

Gemensamma utmaningar för digitaliserade samlingar

Under den avslutande frågestunden diskuterades gemensamma utmaningar och lösningar. Ett föredrag om bildstandarden IIIF (International Image Interoperability Framework) var tvunget att ställas in, men ökad användning av både IIIF och Kulturnav stod högt på önskelistan för att underlätta för sammanlänkning och återanvändning av institutionernas digitaliserade samlingar. Något som också efterlystes var möjligheter att hämta användarskapad metadata från till exempel Wikimedia Commons och återföra till de egna samlingarna.

Aron Ambrosiani
Producent digitala medier, Nordiska museet

Länkade Lämningar

I fredags avslutade Riksantikvarieämbetets program DAP ett kort internt hack om öppna länkade data på RAÄ. Hacket hölls över fyra dagar sprida över två veckor, och ordnades med hjälp av Martin Malmsten från Kungliga biblioteket, som har flera års erfarenhet av att jobba praktiskt med länkade data. Syftet med hacket var att bekanta våra IT-arkitekter och systemutvecklare med länkade data-teknik, och visa hur befintliga datamängder enkelt kan göras till länkade (och länkbara) data. Även att inleda en diskussion kring vägval för vår framtida länkade data, både vad gäller publicering och tjänster.

LOD-hack 2016
LOD-hack 2016
Bild: Åsa Sundin; CC-BY

Läs mer

Ensuring the unexpected

Det här inlägget finns även att läsa på svenska, här.

Just how exciting is linked open heritage data, really? What’s the point – so what? Do normal people really care about unintelligible RDF data claiming to describe a rune-stone from Östergötland?

Information which is “open” should be unfiltered, of high quality, and may be freely used and re-used by anyone. “Linked data” is a standardised method for describing connections between tangible and intangible things and phenomena in such a way that how they relate to one another can be understood by machines.

So how does this apply to the information in databases held by cultural heritage organisations? Läs mer

Hur man gör för att något oväntat ska hända

This post is also available to read in English, here.

Hur spännande är egentligen öppna länkade kulturarvsdata? Man kan nog fundera över vad poängen är. Än sen då? Vilken normal människa bryr sig om obegriplig RDF data som påstår sig beskriva en runsten från Östergötland?

Information som är “öppen” (enligt definitionen), är ofiltrerad, av hög kvalitet och kan fritt vidareutnyttjas av vem som helst. “Länkad data” är en standardiserad metod för att relatera olika ting och företeelser på ett sådant sätt att sakernas relation kan förstås av maskiner.

Så hur gör man nu med den information som finns i kulturarvsinstitutionernas databaser? Läs mer

DAP besöker York

För några veckor sedan åkte Riksantikvarieämbetets verksarkivarie och tre representanter från Riksantikvarieämbetets DAP-program till York i norra England. Resans mål var att lära oss mer om hur den arkeologiska processen går till i Storbritannien och hur de har löst problemen som DAP tar itu med, och framförallt för att lära oss om långtidslagring, tillgängliggörande, och arkivering av digital arkeologisk data på Archaeology Data Service (ADS) hos University of York. Att kunna försäkra långsiktigt, hållbart tillgång till digital arkeologisk data är viktigt för DAP, men idag saknar vi både kompetens och erfarenhet för att kunna skapa den infrastrukturen som behövs för att åstadkomma det.

Läs mer

Länkrika objekt i K-Samsök

Bilden http://kulturarvsdata.se/shm/media/html/14378
Ulf Bruxe SHM

Inom öppna-länkade-data–kretsar pratar man ofta om att det är länkarna mellan digitala objekt som ger värde, snarare än objekten i sig. Länkar sätter ett objekt i sitt sammanhang genom att beskriva hur det relaterar till andra objekt och begrepp. Länkar pekar åt andra ställen som beskriver objektet, och upplyser om andra kopplingar, resurser, och tankebanor. Har man någon gång snabbt slagit upp något på Wikipedia, bara för att inse några timmar senare att man har ägnat halva kvällen åt att följa intressanta länkar från sida till sida tills man hamnat på någon skum artikel som knappast har någonting med det man ville ursprungligen kolla upp att göra… då förstår man väl länkarnas kraft!

K-samsöksplattformen existerar för att förvalta, beskriva, och tillgängliggöra semantiska länkar mellan olika digitala objekt från fler än fyrtio olika minnesinstitutioner. Antalet länkar mellan objekt i K-samsök varierar ganska mycket. Vissa objekt i K-samsöks index har knappast några länkar alls, medan andra sitter mitt i ett rikt nätverk av länkar till hundratals – eller ibland tusentals – andra objekt. Men vilka objekt har flest länkar?

Det är tyvärr inte en enkel fråga att besvara med K-samsöks API:er (K-samsök, UGC-hubben) som inte riktigt stödjer sådana frågeställningar. Men det är en förhållandevis enkel fråga för SPARQL, frågespråket på den semantiska webben och RDF-resurser. Som tur är har vi kvar en triplestore databasserver från förra årets ArkHack i Umeå, som har ett SPARQL gränssnitt och innehåller en delmängd av K-samsöks data från Göteborgs stadsmuseum, Helsingborgs museer, Riksantikvarieämbetet, Svenskt hällristnings forsknings arkiv, Statens historiska museum, och delar av K-samsöks UGC-hubb. Trots att det bara är ett urval ur K-samsöks index, och att datan är snart ett år gammal, så borde detta ändå kunna ge en grov uppskattning om antalet länkar.

Tyvärr – igen – har maskinen med triplestoredatabasen ganska dålig prestanda nuförtiden (den skapades ju bara för ett tillfälligt hack) och klarade inte av att räkna ihop samtliga länkar för alla objekt. Det gick däremot att begränsa frågeställningen något och fråga om vilka objekt som har flest av en specifik sorts länk. I det här fallet valde jag avbildningar – vilka K-samsöksobjekt har flest bilder på sig? Enligt servern är K-samsöks fem-i-topp objekt med flest bilder:

  1. Ållebergskragen, med 160 bilder.
  2. Engelbrektskyrkan, med 136 bilder.
  3. Gamla Uppsala, med 128 bilder.
  4. Mönehalskragen, med 126 bilder.
  5. Ulrika Eleonora Kyrka, med 117 bilder.

Fint!

Men frågan om K-samsöks länkrikaste objekt behöver kanske ändå inte förbli obesvarad. För det finns nämligen ett litet antal kända objekt som har många gånger fler kopplingar till andra objekt än bara några hundra bilder. Sådana objekt har såpass många länkar att det inte går att visa samtliga på Kringla för att sidan skulle ta för lång att ladda. Ett sådant exempel är fornlämningen Bystan, Birka (Adelsö 119:1) som undersöktes 1990–1995 och har länkar till sina alla 106.786 fynd! Bara 89 visas i Kringla, men användare av K-samsöks API kan få ut en fullkomlig lista. Det kanske slår rekordet för K-samsöks länkrikaste objekt!

Ni kan bidra till att öka antalet länkar i K-samsök ni med, och därmed kvalitetshöja datan genom att lägga till länkar i vår UGC-hubb. Det är bara att logga in på Kringla.nu och skapa nya länkar mellan objekt, både inom K-samsök och på Wikipedia, Wikimedia, Libris, Platsr, samt Europeana!

Mr. Smith Goes to Washington

Förra helgen (6–10 november) var jag i Washington, DC, för att delta in en workshop för Project Andvari.

Andvari är ett internationellt projekt, men drivs av Amerikanska forskare på CUA, Mississippi, och Virginia. Projektet har som mål att skapa en forskningsinriktad digital plattform för material – framförallt monument och föremål – från tidig medeltidens Europa (300–1100 talet), med särskild betoning på ikonografi. Jag var med på det första projektmötet i fjol; projektet ska byggas på öppna länkade data, och jag deltar för att ge råd om tekniken och öppna svensk kulturarvsdata.

Läs mer

CAA 2014, Paris

CAA – Computer Applications and Quantitative Methods in Archaeology – är en årlig internationell konferens för arkeologer, matematiker och dataloger om användning av digitala tekniker inom arkeologi. För några veckor sedan var jag med på den 42:a konferensen i Paris. Jag var där för att presentera Riksantikvarieämbetets arbete med DAP-programmet och för att lära mig om andra projekt – såväl pågående som avslutade – som skulle kunna ha bäring på DAP eller som vi som jobbar med DAP skulle kunna använda inom vårt arbete. Läs mer

ArkHack 2.0

I fjol höll vi ett ”hack” om kulturarvsdata i Riksantikvarieämbetets lokaler i Visby, där deltagare från flera olika institutioner var med för att hitta gemensamt värde genom att länka ihop sina respektive datamängder. Hacket var så lyckat, att vi ordnade en uppföljare förra veckan, i anslutning till Vårmötet i Umeå och i samarbete med HUMlab på Umeå universitet.

Den här gången på ”ArkHack 2.0” lockade vi flera deltagare från ett antal olika organisationer. Hacket hölls som ett kollaborativt labb över två dagar 7:e-8:e april på Umeå universitets häftiga HUMlab-X lokaler, med målen att deltagarna skulle hitta kopplingar mellan sina respektive datamängder samt nya sätt att visa upp information från flera källor, lära känna olika verksamheters behov och informationsmängder, lära sig mer om teknik, metoder och attityder kring öppna länkade data, skapa bra förutsättningar för samverkan framöver… och framförallt att ha roligt! :) Det här var inte någon tävling, utan snarare ett sätt för deltagarna att lära sig mer om varandras information, och framförallt hitta kopplingar de emellan, med hjälp av öppna länkade data teknik.

Läs mer