Taggad: Protokoll

Uppdatering i dokumentationen (version 1.1)

När man, i rdf, hänvisar till en annan resurs eller objekt med ett unikt ID har det tidigare i dokumentationen stått att det ska göras enligt modellen:

<isVisualizedBy>http://www.domän/institution/tjänst/id</isVisualizedBy>

Eftersom standard för rdf är att använda rdf:resource så kommer vi i o m version 1.1 att rekommendera modellen:

<isVisualizedBy rdf:resource=”http://www.domän/institution/tjänst/id”/>

Båda varianterna fungerar, den första dock senast till 30 juni 2013.

>> Johan Carlstöm – systemförvaltare för K-samsök

 

Om användargenererat innehåll och Wikipedia


Wikipedia globe in a keychain! Foto: @bastique (Creative Commons by-nc)

Som beskrevs i bloggposten kring det nya protokollet har vi från och med protokoll 1.1 en möjlighet att hantera komponenter i vår information på ett sätt som berikar vår information och gör den mer meningsfull för användaren. Det vi inte tog upp då var att även användaren kommer att ha möjligheten att berika och förfina vår information. Detta görs med hjälp av ett tillägg till K-samsök, som håller reda på relationer mellan objekt, som vi kallar för UGC-hubben. UGC står i det här fallet för User Generated Content –Användaregenererat innehåll.

Varför låter man användaren hantera information? I och med att informationssamhället slår igenom blir det svårt, för att inte säga omöjligt, för informationsförvaltare att ha kontroll över all ”sin” information. Det kan handla om miljontals objekt för ett enskilt museum. Därför är den generella utvecklingsriktningen för digitala resurser att man låter de som intresserar sig för informationen förbättra den på olika sätt. Det kan handla om att tala om att två instanser av objektet ”Drottning Kristina” (från t ex två olika museer) egentligen handlar om samma person, eller att koppla ihop en sko från ett museum, med en hatt från ett annat, via en person som varit ägare ellertillverkare till båda objekten.

I nuläget är detta bara möjligt att göra i Kringla men vi ser över möjligheterna att öppna upp ytterligare.

UGC-hubben möjliggör för tjänster att hämta information som vi själva eller användare har länkat ihop. Detta skapar bättre förståelse för informationen, och högre kvalitet. Ytterligare en del av det hela är att vi som informationsägare bättre kommer att förstå vad våra användare vill ha av oss, eftersom vi kan se vad de vill göra med informationen, och att vi kan se vadsom är mest relevant för dem.

UGC-hubben kommer på sikt även att kunna användas för att länka till en annan stor källa till användargenererad information: Wikipedia. Redan idag ingår Wikimedia Foundation (som driver sajten Wikipedia) som partner i flera viktiga samarbeten med kulturarvsinstitutioner världen över. Det är en tidsfråga innan vi kan låta vårt material berikas av deras genom t ex mobilappar och andra tjänster som sätter ihop information från olika håll, till gagn för användaren.

>>Henrik Summanen jobbar med verksamhetsutveckling och K-samsök på Riksantikvarieämbetet.

Ändringar och tillägg i K-samsök 1.1

Under hösten 2011 utvecklades K-samsök i en version 1.1. Fokus låg på att vidareutveckla protokollet så att det på ett smartare sätt stödjer webbsemantik och bredda K-samsök för att kunna hatera flera typer av information, bl a kring personer och händelser. Den nya protokollet är framtaget av Riksantikvarieämbetet i nära samverkan med de institutioner som hittills levererar data till K-samsök. Nedan följer de ändringar som gjorts.

Än så länge återstår uppdatering av dokumentationen samt de engelska sidorna.

Läs mer om ändringar i K-samsök 1.0 till 1.1 (pdf)

Objekttyper (itemType)

För att gruppera objekttyperna har en övergripande typ införts (itemSuperType) som är obligatorisk. Den är en URI som itemType och måste ha något av värdena (prefixat av http://kulturarvsdata.se/resurser/EntitySuperType#):

Nya superobjektstyper (itemSuperType)

  • Agent (agent)
  • Fysiskt ting (object)
  • Händelse (event)
  • Koncept (concept)

Alla pre-1.1-objekttyper hamnar i strukturen under Fysiskt ting.

Nya objektstyper (itemType)

  • Karta (map)
  • Kulturlämning (monument)
  • Byggnad (building)
  • Person (person)
  • Organisation (organization)
  • Grupp (group)
  • Historisk händelse (event)
  • Utställning (display)
  • Koncept (concept)

Förändrade objektstyper

  • Objekttypen Objektavbildning (objectImage) har utgått
  • ”Miljö” (site) har delats upp i tre delar: Byggnad (building), Kulturlämning (monument) och Kulturmiljö (culturalLandscape). Miljö finns kvar till vidare för bakåtkompatibilitet.

De nya objekttyperna har som tidigare prefixet http://kulturarvsdata.se/resurser/EntityType#. K-samsök kräver i o m version 1.1 att itemType verkligen är någon av de definierade typerna för att en post ska godkännas vid skördnig till K-samsök.

RDF-resurser för itemType och itemSuperType kommer finnas att läsa här.

Agenter

Eftersom Agenter är aktörer (omfattar både personer, organisationer och grupper) finns behov av kontexter som hanterar liv, verksamhet och död. Kontexterna har ändrats till att bli mer allmängiltiga create-interaction-destroy (med underkategorier), för att underlätta detta. Det finns också behov av flera olika nya relationer med anledning av de nya objektstyperna t.ex. för att beskriva släktskap. Dessa listas nedan.

För agenter har nya fält tillkommit på toppnivån. Det handlar om:

  • name
  • gender
  • title
  • nameAuth
  • nameId
  • firstName
  • surname
  • organization.
  • fullName

Samtliga tillägg är från foaf som har använts i tidigare protokollversioner (ex http://xmlns.com/foaf/0.1/#name).

Event

Event är händelser av makro-karaktär, som historiska händelser, bröllop, slag, utställningar etc som är avgränsningsbara i tid och rum. De ska inte blandas ihop med kontexterna som är händelser i ett enskilt objekts livscykel.

Koncept

Koncept (SKOS Concept) är företeelser som inte är avgränsningsbara i tid och rum. T ex Vikingatid, Stormaktstid, Sjöfart etc. Dessa objektstyper används huvudsakligen för att göra mappningar från museer med ett visst ansvarsområde (t ex Historiska museet=Medeltid/förhistorisk tid). Koncept kopplas med fördel direkt mot Wikipedia.

 

Kontexttyper (contextType)

I o m version 1.1 har kontexttyperna förändrats. Precis som för objekttyperna så har en obligatorisk supertyp (contextSuperType) införts för de generella (prefixat av http://kulturarvsdata.se/resurser/ContextSuperType#):

  • Skapa (create)
  • Interagera (interact)
  • Upphöra (cease)

Kontexttyperna som tillkommit och avskaffats är:

Tillkommit

  • Starta (start)
  • Designa (design)
  • Producera (produce)
  • Visa (display)
  • Verka (act)
  • Avföra (dismiss)
  • Avsluta (stop)

Andra förändringar

  • Belägen (exists) har avskaffats.
  • Fotograferad (reproduced) har blivit Reproducerad (reproduce)
  • Tillverkad (create) har flyttat till att bli en supertyp.
  • Förstörd (destroyed) har övergått till supertypen Upphöra (cease)

ContextLabel har förändrats, iom 1.1 indexeras alltid en inskickad contextLabel om den finns istället för rdf-resursen. Värden för contextType (och contextSuperType) måste vara enligt standardiserad värdemängd för att poster ska indexeras.

RDF-resurser för contextType och contextSuperType finns här.

Relationer

Några nya relationer har tillkommit på toppnivå, dvs mellan objekt. De flesta har att göra med de nya objekttyperna.

Nya relationer

  • isMentionedBy /nämns av (k-samsöks NS)
  • mentions/nämner (k-samsöks NS)
  • child/förälder till (BIO, prefix http://purl.org/vocab/bio/0.1/)
  • parent/barn till (BIO)
  • mother/har mor (BIO)
  • father/har far (BIO)
  • P12F.occurred_in_the_presence_of/händelsen skedde i närvaro av (CIDOC-CRM, prefix http://www.cidoc-crm.org/rdfs/cidoc-crm#)
  • P12B.was_present_at/var närvarande vid händelse (CIDOC-CRM)
  • P11F.had_participant/händelsen hade deltagare (CIDOC-CRM)
  • P11B.participated_in/deltog i händelse (CIDOC-CRM)
  • P107B.is_current_or_former_member_of/är eller var tidigare medlem i (CIDOC-CRM)
  • P107F.has_current_or_former_member/har eller hade medlem (CIDOC-CRM)

Notera att CIDOC-CRM-relationernas index/värden inte har med P-prefixet, utan bara namnet, t ex was_present_at.

Roll-relationer

Ett antal nya relationer som utgår från kontexten och som pekar på agenter har också tillkommit i k-samsöks NS och från CIDOC-CRM. Nya kontext-/roll-relationer är (i k-samsöks NS om inget annat anges) :

  • Beställare (client)
  • Kompositör (composer)
  • Författare (author)
  • Arkitekt (architect)
  • Uppfinnare (inventor)
  • Scenograf (scenographer)
  • Designer (designer)
  • Producent (producer)
  • Arrangör (organizer)
  • Regissör (director)
  • Fotograf (photographer)
  • Målare (painter)
  • Byggare (builder)
  • Byggmästare (masterBuilder)
  • Byggherre (constructionClient)
  • Gravör (engraver)
  • Myntmästare (mintmaster)
  • Konstnär (artist)
  • Konstruktör (designEngineer)
  • Snickare (carpenter)
  • Murare (mason)
  • Tekniker (technician)
  • Förläggare (publisher)
  • Publicist (publicist)
  • Musiker (musician)
  • Skådespelare (actorActress)
  • ryckare (printer)
  • Påskrift av (signer)
  • Upphittare (finder)
  • Förvärvare (abandonee)
  • Förmedlare (intermediary)
  • Köpare (buyer)
  • Säljare (seller)
  • Generalagent (generalAgent)
  • Givare (donor)
  • Deponent (depositor)
  • Återförsäljare (reseller)
  • Inventerare (inventoryTaker)
  • Grävare (excavator)
  • Undersökare (examinator)
  • Konservator (conservator)
  • Arkivbildare (archiveContributor)
  • Intervjuare (interviewer)
  • Informant (informant)
  • Patentinnehavare (patentHolder)
  • Brukare (user)
  • Skanneroperatör (scannerOperator)
  • Bildredaktör (pictureEditor)
  • Arbets- eller uppdragsgivare (employer)
  • Har nuvarande eller tidigare förvaltare (P49F.has_former_or_current_keeper CIDOC-CRM)
  • Har nuvarande eller tidigare ägare (P51F.has_former_or_current_owner CIDOC-CRM)
  • Skapades av (P94B.was_created_by CIDOC-CRM)
  • Rättigheter ägs av (P105F.right_held_by CIDOC-CRM)

Notera att CIDOC-CRM-relationernas index/värden inte har med P-prefixet, utan bara namnet, tex was_created_by. Notera också att fn kan man bara ange dessa relationer utgående från kontextet, och inte från ”andra hållet” från den utpekade agenten.

”Kontextindex” med typ och supertyp

Nytt är också i o m införandet av kontextsupertyper att ”kontextindex”, dvs tex use_fromTime även bildas med supertypen. Om ett fromTime-värde finns i ett kontext där kontexsupertypen är ”create” och kontexttypen är ”start” så kommer värdet indexeras i både create_fromTime och start_fromTime.

Version 1.1 driftsatt

Uppdaterat 2012-02-02: Tyvärr kommer vi inte att hinna uppdatera sidan som beskriver protokollet idag. För en kort sammanfattning över ändringar, se sidan med protokollversioner.

Nu har vi driftsatt version 1.1 av K-samsök och allt har gått bra. Vad som återstår är att färdigställa dokumentationen vilken kommer att publiceras under dagen. Informationen eller länkar till den kommer sedan att läggas ut här på bloggen.

Hälsningar
Johan Carlström – systemansvarig för K-samsök

 

Snart kommer K-samsök 1.1


By: loop_oh (CC-by)

Under hösten 2011 utvecklades K-samsök i en version 1.1. Fokus låg på att vidareutveckla protokollet så att det på ett smartare sätt stödjer semantik och bredda K-samsök för att kunna hatera flera typer av information, bl a kring personer och händelser. Vi kommer att driftsätta dessa ändringar under nästa vecka och mer information kommer att publiceras då.

Det handlar i första hand om tillägg, men vissa parametrar har tagits bort och som används av få eller inga aktörer, och är lätta att mappa om. Flera olika objektstyper ligger kvar för att vara bakåtkompatibla med portar som inte hinner skrivas om, och för att inte göra allt för stora förändringar samtidigt. De stora tilläggen av objektstyperna Agenter (person, organisation eller grupp), Koncept (företeelser som ej är begränsade till tid eller rum) och Event (händelse, t ex ett bröllop), vilket kan sägas semantisera K-samsök ytterligare. Kontexterna ändras också till att vara mer allmängiltiga och fungera även för Agenter och Event (Koncept har inga kontexter i nuläget).

Eftersom de nya objekstyperna är av allmängiltig karaktär (samma person kan t ex figurera i flera databaser, liksom Eventen) så är det viktigt att man kan hantera detta med SameAs-relationer med hjälp av Auktoriteter (dvs unika identiteter för t ex personer, länder mm) och så småningom ska dessa visas som ett och samma objekt. Man kan t ex relatera Agenter med SameAs-relationer till Libris som i sin tur relaterar till VIAF, men det kommer också att behövas branschspecifika listor (för t ex fotografer eller konstnärer). I ett första steg skördas Livrustkammaren och Skoklosters slott med Stiftelsen Hallwylska museets (LSH) person och organisationmodul ur sin samlingsdatabas och matchas mot Libris personlista.

Bakåtkompatibelt

Version 1.1 är bakåtkompertibelt vilket innebär att mappningar mot äldre versioner av protokollet kommer att fungera även framöver, dock längst till juni 2013.

Tredjepartstjänster – API

För tredjepartstjänster som använder K-samsöks API innebär förändringarna inget akut.  Det kommer att finnas nya sätt att filtrera fram informationen, det kommer t ex gå att filtrera fram byggnader och kulturlämningar utifrån itemType (objetstyp). När det finns information som använder nya protokollet så meddelas det via denna blogg.

Har du frågor får du gärna ställa dem som en kommentar till detta blogginlägg eller till ksamsok (at) raa.se.

>> Johan Carlström – tf systemansvarig

Att använda Creative Commons


Låt oss säga att du jobbar på en institution som vill tillgängliggöra bildmaterial under en Creative Commonslicens. Hur gör man detta på bästa sätt när man mappar mot K-samsök? Jag kommer att använda en av Historiska museets bilder för att illustrera (bilden ovan).

För bilder/foton (image) finns följande parametrar:

  • <thumbnailSource> – Länk till tumnagelbild, länk till bildfilen (inte sidans HTML-sida)
  • <lowresSource> – Länk till lågupplöst bild (webbformat, förslagsvis minst 600 pixlar bred), länk till bildfilen (inte sidans HTML-sida)
  • <highresSource> – Länk till högupplöst bild inte sidans HTML-sida), länk till bildfilen (inte sidans HTML-sida)
  • <byline> – Bildttext som ska innehålla minst fotograf. Kan innehålla institution men detta kan även skriva under <copyright>. Är inte fotografen känd så kan ska det stå ”Okänd”.
  • <mediaMotiveWord> – Bildtext.
  • <copyright> – Person eller organisation som äger den ekonomiska rätten till bilden. Är skyddstiden för t ex ett foto utgången (t ex 50 år efter fototillfället för en fotografisk bild) så ska inte denna användas.
  • <mediaLicense> – URI till licensen, t ex: http://kulturarvsdata.se/resurser/License#by-nc-sa
  • <mediaLicenseUrl>URL till specifik version av licensen, t ex http://creativecommons.org/licenses/by-nc-sa/2.5/se/. Fylls inte denna i så användes det som är definierat som standard i rdf-resursen för licenser/upphovsrätt.

Bilden ovan skulle förslagsvis se ut som följer i rdf-representationen:

<mediaType rdf:resource=”http://kulturarvsdata.se/resurser/MediaType#image/jpeg”/>
<thumbnailSource>http://catview.historiska.se/catview/media/thumbnail/309859</thumbnailSource>
<lowresSource>http://catview.historiska.se/catview/media/309859</lowresSource>
<highresSource>http://catview.historiska.se/catview-test/media/highres/309859</highresSource>
<byline>Karin Olsson, 2007-02-01, SHMM</byline>
<mediaMotiveWord>Föremål från Historiska museet</mediaMotiveWord>
<mediaMotiveWord>Flintkniv</mediaMotiveWord>
<copyright>SHMM</copyright>
<mediaLicense>http://kulturarvsdata.se/resurser/License#by-nc-sa</mediaLicense>
<mediaLicenseUrl>http://creativecommons.org/licenses/by-nc-sa/2.5/se/</mediaLicenseUrl>

Eftersom Historiska museet använder den version av licensen som vi satt som standard så hade de inte behövt att välja något under <mediaLicenseUrl>. Det skadar dock inte att göra det ändå.

>> Johan Carlström  – projektledare för K-samsök på Riksantikvarieämbetet.

Träffade GBIF

Förra veckan träffade jag, Lars Lundqvist och Börje Lewin repesentanter för GBIF Sverige (Global Biodiversity Information Facility). GBIF är ett samarbete mellan museer, institutioner, organisationer och myndigheter som har naturhistorisk data för att tillgängliggöra denna för t ex samsökningstjänster. Känns det igen? :) GBIF har 90 medlemmar från 50 länder och bara i Sverige så finns drygt 21 miljoner poster. Vi identifierade snabbt beröringspunkter gällande t ex osteologiska samlingar… Skulle det vara intressant att söka i Historiska museets bensamlingar och samtidigt få träffar på naturhistoriska institutioner? För att detta ska fungera är det vitkigt att det finns ett latinskt namn i objektsbeskrivningen.

>>Johan Carlström, projektledare

GBIF är samtidigt intresserade av att kunna visa vad som hänt på en plats utöver rent naturhistoriska data. Nästa steg är att se om K-samsök kan skörda GBIF och om man får fram vettiga resultat.