Om K-samsök och förbättringar

Vi har under det senaste året utvärderat hur väl K-samsöks struktur fungerar, både i relation till andra informationskällor och gällande möjligheterna att beskriva och länka information inom systemet. Vi har också fått en teknisk review av K-samsök, med tydliga resultat gällande hur väl systemet fungerar i sin samtid. Resultatet har visat att det finns problem att göra fullgoda beskrivningar utifrån protokollet så som det är uppbyggt idag, men också att de flesta som jobbar mot K-samsök tycker att det fungerar bra.

Det grundläggande problemet när det gäller hur informationen är uppbyggd, är att K-samsök har ett så kallat “platt” protokoll. Detta betyder att den mesta informationen är direkt länkad till huvudobjektet, utan olika abstrakta mellannivåer. Detta innebär att det inte går att sortera in de gröna klossarna i något annat än den gröna-kloss-lådan, även om man har blandat dem med de röda, vilket man kanske ibland har i sin egen databas. Det finns flera modeller inom kulturarvssektorn som har väldigt genomarbetade modeller för kulturarvsinformation. Främst är kanske CIDOC-CRM, den konceptuella referensmodellen skapad inom ramarna för den internationella museiorganisationen ICOM. Modellerna blir av naturen lite besvärliga att begripa, och en del av parametrarna blir väldigt abstrakta och svåra att vid en översyn förstå. Normalt sett behöver man flera exempel för att se hur det är tänkt att modellen ska användas. Men en stor fördel som finns med att använda sig av denna typ av standard är att de ofta är färdigmappade mot andra standards (t ex Dublin Core eller Europeana Data Model). Detta sparar väldigt mycket tid, både för informationsförvaltare, aggregatorer och utvecklare.

Så hur ska vi då gå vidare med just K-samsök? Det som kännetecknar väl modellerade informationsmodeller är ofta att de blir väldigt lika varandra. Detta är en ren konsekvens av att man sätter sig ner med ett antal olika informationskällor och försöker se på vilka sätt de skulle kunna få rum inom samma modell. Men modellerna blir normalt sett också ganska abstrakta, och som sagt, svåra att förstå sig på. En annan effekt är också att vi som jobbar med K-samsök, om vi satte oss ner och modellerade upp informationen vi hanterar med stor sannolikhet skulle hamna väldigt nära CIDOC-CRM, och de andra liknande modellerna. Så nu när vi sätter oss ner med all vår data under våren, från arkeologiska provsvar till webbsidor, blir det en övning i att förutom att förstå Riksantikvarieämbetets egen information också förstå relationen mellan den och en mer övergripande modell.

Här kan vi göra ett vägval. Vi kan bestämma oss för att hantera vår information utifrån en egen modell, som vi gör idag, eller att jobba med en modell som redan finns inom domänen. Gärna en välbeskriven sådan. Förtjänsten med det andra alternativet är att någon redan har gjort merparten av jobbet åt oss, och det svåraste blir att se hur vi ska passa in vår egen information i denna mall. Närmast till hands för detta ändamål är LIDO, ett informationsutbytesformat som är baserat på CIDOC-CRM, och används främst av museer. Med vissa komplement skulle detta format kunna uttrycka allt som K-samsök redan gör, och lite till, fast tydligare. Så länge man kan bibehålla abstraktionsnivåer för informationen – granuläriteten – så förstörs väldigt lite information på vägen genom aggregationsledet, något som annars betraktas som ett problem.

Under året kommer vi att fatta beslut som rör framtiden för K-samsök. Vi kommer att titta på hur stora möjligheter vi har att ändra i protokollet utan att det får för stora konsekvenser, och vi kommer att titta på de vinster vi kan göra av att ha en mer välformulerad modell för informationen. Det är en fråga som rör sig i domänerna kvalitet, eller kvantitet. Idag har vi en färdig infrastruktur. Den är inte perfekt, men den gör kanske 90 procent av jobbet. Hur snart är vi villiga att kliva över i en modell som kräver ganska mycket av både informationsförvaltarna (t ex kan nya portar behöva byggas), aggregatorerna (som K-samsök och Europeana) samt utvecklarna (som måste ändra i sina applikationer utifrån nytt protokoll), men som ger oss 100 procent av kapaciteten i en viss andel av de samlingar som vi aggregerar. Det är en fråga som kräver ett ganska kvalificerat svar.

Men en del av svaret vet vi redan. Det handlar inte i första hand OM K-samsök ska ha en mer välmodellerad modell för sin information, utan när.

>>Henrik Summanen jobbar med K-samsök på Riksantikvarieämbetet

Skriv en kommentar