Taggad: Förvaltning

Vi planerar ett möte för informationsförvaltare


Georgia? Fotograf: Delano, Jack, ca 1940.

Vi har ambitionen att kalla samman er som levererar data till K-samsök till ett möte strax efter semestrarna. Förslag på datum kommer snart men jag vill redan nu fråga om det finns något ni vill ta upp? Från Riksantikvarieämbetets sida finns bl a:

  • Nytt avtal och rättighetsmodell.
  • Leverans till Europeana (om-mappning till EDM, aktuella Europeana-projekt).
  • Det pågår flera samarbeten med Wikipedia/Wikimedia Sverige – Hur kan dessa samarbeten komma K-samsök till nytta på bästa sätt?

>> Johan Carlström – systemförvaltare för K-samsök

Vad innebär Europeanas rättighetsmodell för K-samsök?

K-samsök levererar data till Europeana som visas i portalen www.europeana.eu. Informationen i Europeana är även nåbar via ett API. Sedan årsskiftet använder Europeana en ny rättighetsmodell som jag tidigare skrivit om.

Enligt det avtal/överenskommelse som informationsleverantörer skriver med Riksantikvarieämbetet så gäller följande:

”K-samsök möjliggör uppmärkning av rättigheter på objektsnivå och Riksantikvarieämbetet uppmanar IF att märka upp sina objekt för att tydliggöra vad tillämpningsutvecklare och andra användare får göra med dessa.”

Idag går det att i K-samsök att märka upp metadata och media (bilder, ljud mm) med olika licenser. Detta görs idag enligt denna modell:

  • Allmänt tillgängligt (public) – Objektet är allmänt tillgängligt utan restriktioner (motsvarande ”public domain”), inkluderar objekt med utgången skyddstid och information som inte faller inte ramen för upphovsrätten, t ex fakta.
  • Okänd status (unknown) – Objektets upphovsrättsstatus är okänd, sätts automatiskt på alla objekt som inte är uppmärkta av inforamtionsförvaltaren. Detta innebär att det blir svårt att återanvända informationen och därför uppmanas informationsförvaltaren att märka upp informationen. Även s k Orphan works där skyddstiden bedöms ha gått ut kan använda ”Okänd”.
  • Creative Commons – En informationsförvaltare kan märka upp informationen med de sex Creative Commonlicenserna där ”2.5 Sverige” (exempel) är satt som standard.
  • Public Domain Mark – Public Domain Mark är en icke juridiskt bindande märkning av material där upphovsrätten gått ut eller där materialet inte skyddas av upphovsrätten. Märkningen är framtagen av Creative Commons och används bl a av Europeana.
  • Alla rättigheter reserverade (all rights) – Objektet är helt skyddat av upphovsrätt och institutionen måste kontaktas för att användning ska vara möjlig. Denna variant försvårar återanvändning av informationen och bör undvikas om möjligt.

Det finns en del skillnader mellan denna modell och Europeanas, t ex en del osäkerhet kring all rights (som inte är lika flexibel som hos Europeana) och unknown som, i fallet K-samsök, används som ”slaskpost” för material som inte är uppmärkt hos informationsförvaltarna. Det saknas även licenser för ”public domain dedication”, t ex CC0. K-samsöks modell behöver modifieras för att fungera med fler typer av information i linje med arbetet kring PSI-direktivet och Open Data. Ett annat skäl är att i större utstäckning använda standardiserade och maskinläsbara öppna licenser.

I avtalet står det att Informationsförvaltaren garanterar:

”IF har märkt upp sitt material så att det blir tydligt mot Riksantikvarieämbetet och tredje part hur detta får användas och vidareutnyttjas.”

Även om fler och fler har märkt upp sin data enligt modellen ovan så är det långt från alla som gjort detta idag.

Alla metadata som levereras till Europeana får märkningen CC0 enligt deras Data Exchange Agreement. Detta innebär att metadatan är fri att använda utan restriktioner. I K-samsök är det idag möjligt att märka metadata med andra licenser,  t ex de övriga Creative Commons-licenserna. Detta skapar redundans och det blir svårt för K-samsök att leverera denna data till Europeana. Det medför även otydlighet mot tredjepartsutvecklare som använder K-samsök via API:et.

Otydligheter i avtalet
Det kan i K-samsöksavtalet uppfattas otydligt vad som är att betrakta som objekt, är det metadataobjektet, den digitala representationen (t ex den scannade bilden eller den digitaliserade boken) eller den fysiska artefakten i museets magasin? Det är även otydligt vad som är metadata och vad som är ”content” (dvs den information som metadatan representerar, t ex en scannad bild).

Att viss data idag inte är uppmärkt i K-samsök innebär problem i leveransen till Europeana. I o m att <edm:rights> i Europeanas datamodell är obligatoriskt skapar det problem när det finns icke uppmärkt data i K-samsök. Hittils har dessa varit märkta med ”unknown” i mappningen mot Europeana vilket utifrån definationen ovan är felaktigt (Unknown används för verk med okänd upphovsman).

Möjliga lösningar på detta problem är:

  1. Europeana skördar inte dessa objekt från K-samsök.
  2. Om mediaLicense saknas märks objektet med Rights reserved – free access  i mappningen mot Europeana. Detta är inte den bästa lösningen eftersom även fria objekt kan kommer att få denna märkning. Detta borde dock vara ett minskande problem i takt med att informationsförvaltarna märker upp sin information. Avtalet behöver formuleras om för att detta ska vara möjligt.

Möjliga vägar framåt
Det är önskevärt att informationsflödet från informationsförvaltare, via K-samsök och Europeana till tredje part (via API) går till på ett smidigt och enhetligt sätt. För att underlätta för applikationsutvecklare är det även önskvärt att informationen är uppmärkt på ett enhetligt sätt, oavsett var den hämtas ifrån. Detta gör det enklare att kommunicera vad som gäller kring rättigheter samt möjliggör för Riksantikvarieämbetet att tillgängliggöra informationen i K-samsök som Linked Oped Data. För att uppnå detta behöver vi göra vissa förändringar i K-samsök och det tillhörande avtalet. Dessa  förändringar är: 

  • Alla metadata som levereras till K-samsök får samma öppna licens som är anpassad för metadata,  t ex CC0. CC0 lämpar sig för att det redan används av Europeana och andra institutioner, t ex Kungliga Biblioteket. Detta innebär att <itemLicense> sätts automatiskt i den lokala porten/mappningen. Avtalet behöver omformuleras för att detta ska vara möjligt.
  • Implementera Eurpeanas modell för right statements i K-samsök kopplat till <mediaLicens> för att underlätta aggregering och återanvändning. Förslagsvis utgår vi ifrån rdf-resusern för licsenser och anpassar där det behövs. Avtalet behöver omformuleras för att detta ska vara möjligt.
  • Elementet <image> ersätts av <media> för att kunna användas bredare (t ex för direktlänkar till ljudklipp eller fulldigitaliserade böcker) och enklare kunna mappas mot Europeanas objektstyper. Typen av media definieras via <mediaType>. Här bör det finnas en möjlighet att under en övergångsperiod kunna använda <image> för bakåtkompabilitet.
  • All media som inte är märkt vid skördning till K-samsök märks automatiskt med Rights reserved – free access enligt Europeanas modell.  Detta försvårar förvisso återanvändning men tydliggör vad som gäller, både mot Europeana, tredjepart och slutanvändare (via t ex Kringla). Detta är inte den optimala lösningen men gör att vi slipper filtrera bort media vid skördningen till K-samsök.
  • Hittils har K-samsök inte skördat metadata om objekt som är upphovsrättsskyddat och/eller som användaren måste betala för. Då Europeana har en ambition att ta in mer sådan data (korrekt uppmärkt) finns det ett behov att likrikta K-samsöks ambition kring dessa frågor. Eftersom metadatan är fri skapas ändå förutsättningar att länka ihop denna typ av data med andra källor enligt principerna kring Linked Open Data.
Vad innebär detta för institutionerna som levererar data till K-samsök?
Tanken är att göra den reviderade rättighetsmodellen så bakåtkompatibel som möjligt. Inget av förslagen ovan är beslutade utan är att betrakta som arbetsmaterial.  Vårt mål är dock att ”sätta ner foten” relativt snart, förhoppningsvis redan vid halvårsskiftet då Europeanas Data Exchange Agreement börjar gälla i sin helhet.
Jag är nyfiken på vad ni tycker om förslagen. Är det något som saknas? Kommentera gärna.

>> Johan Carlström – systemförvaltare för K-samsök

Leveransprocessen, version 0.2

Här kommer en ny version av kartan över processen för leverans till K-samsök. Ändringar är:

  • Jag har tydliggjort att det är Riksantikvarieämbetet som för en dialog med Europeana kring leverans av datasets.
  • Jag har lagt in en ruta kring avtalet/överenskommelsen redan i början av processen. Det är viktigt att den aktuella institutionen redan från dag 1 är medveten om vad det innebär att leverera data till K-samsök och Europeana gällande t ex uppmärkning av information.

>> Johan Carlström – systemförvaltare

Processen för leverans av ny information till K-samsök

Vi har försökt att kartlägga processen kring leverrens av ny information till K-samsök och Europeana. Anledningen är att tydliggöra för nya institutioner och oss själva vilka viktiga punkter det finns vid ett leveransförfarande.

Använder en institution ett system som redan kan leverera information till K-samsök (Primus, Carlotta, MuseumPlus) är vägen ganska kort från första kontakt till leverans. Är systemet inte bekant för K-samsök ingår fler steg.

Viktiga delar:

  • Vilken typ av system använder institutionen?
  • Uppmärkning av media med öppna licenser
  • Vill institutionen att informationen levereras vidare till Europeana?

Detta är fortfarande arbetsmaterial så kom gärna med feedback, frågor och kommentarer.

>>Johan Carlström – systemförvaltare

K-samsök i förvaltning

Nu övergår K-samsök från att vara ett tidsbegränsat projekt till att bli linjeverksamhet och ett förvaltningsobjekt i Riksantikvarieämbetets IT-miljö. Just nu jobbar jag med att färdigställa alla förvaltningsdokument, uppdatera hemsidan, planera inför det resterande året mm.

En K-samsök 1.0 innebär att K-samsök som teknisk infrastruktur och protokoll finns i en godkänd och stabil version . Detta innebär dock inte att det är ”färdigt” utan vi sammanställer just nu en backlog med önskemål om vidareutveckling. Några punkter med önskemål och saker som är på gång är:

  • Json – för att skicka kompakta datapaket, underlättar för utvecklare som vill bygga t ex mobila applikationer.
  • Diskussioner och skördning av MuseumPlus.
  • Vi har blivit kontaktade av Statens musiksamlingar, Riksteatern, Lantmäteriet och Filmarkivet (KB+svenska filminstitutet). Vidare diskussioner kommer att föras kring skördning till K-samsök.
  • Översyn av parametrar (t ex objektstyp och ämne).
  • Tydligare texter kring parametrar (white paper).
  • ”Datapaket”, t ex berättelser från platsr.se.
  • Skördning av användargenererad data. Troligtvis behövs nya parametrar för detta.
  • Leverans av kulturmiljöobjekt till Europeana via Carare.
  • Tydligare policys kring öppen länkad data, fri metadata är en förutsättning.
  • Utredning kring vilken statistik som är intressant.

Den 22/2 träffar vi (jag själv, Lars Lundqvist och Johanna Berg) de som levererar data till K-samsök idag, i Stockholm. Då kommer vi att gå igenom vad som hänt under 2010 samt hur vi vill jobba framöver. Tanken är att etablera en extern referensgrupp med informationsförvaltare som levererar data till K-samsök (dvs de vi träffar den 22:a) samt ett intressentråd för strategiska frågor. Mer om detta senare.

På Riksförbundet Sveriges museers community pågår just nu en bra diskussion om utveckling av K-samsök, titta gärna in där eller kommentera här.

>>Johan Carlström – systemförvaltare K-samsök