Kulturdepartementets strategi for åpne data

Til innholdsfortegnelse

Status for bruk av åpne data

Generelle betraktninger

Vi har lite kunnskap om bruken av åpne kulturdata. Det finnes foreløpig ingen statistikk som viser bruken av APIene, og det er ikke gjort brukerundersøkelser som kan si noe om hvem som bruker hvilke data til hva. Ingen av etatene har implementert løsninger for logging av bruken av de åpne APIene. Basert på den begrensede informasjonen man har er det grunn til å anta at det er relativt lite bruk av åpne kulturdata, spesielt i form av nye tjenester fra tredjepart.

Erfaringen viser også at det er nødvendig med tiltak for å øke kjennskapen til og bruken av åpne kulturdata.

Direkte tilgjengeliggjøring vs. aggregatorer/data.norge.no

Kulturdata er tilgjengelige gjennom API-er, web-tjenester, filer for nedlasting, bruk av åpne formater, etc. Institusjonene har i varierende grad valgt å bruke fellestjenester som data.norge.no og Norvegiana for dokumentasjon og tilgjengeliggjøring. Det er også noe varierende hvordan datasett og tjenester er dokumentert på institusjonenes egne nettsider.

Tabellen under illustrerer dette.

Datasett

Institusjon

Dokumentasjon på institusjonens egen nettside

Dokumentasjon på data.norge.no

Tilgjengelig i Norvegiana

Arkivportalen

Stiftelsen ASTA

Nei

Nei

Ja

Folketellingen 1910

Arkivverket

Nei

Ja

Ja

NBdigital

Nasjonalbiblioteket

Ja

Nei

Nei

Bokhylla

Nasjonalbiblioteket

Ja

Nei

Nei

Digitalt Museum

KulturIT

Nei

Ja

Ja

Bruk av åpne samlingsdata

Digitalarkivet (Arkivverket) og Bokhylla (Nasjonalbiblioteket) er sektorens mest brukte webtjenester i dag. Populære data i Digitalarkivet er folketellinger, kirkebøker, adressebøker og andre «slektsgranskningrelaterte» data. Av disse er det kun folketellingen fra 1910 som er tilgjengelig som åpne data på data.norge.no. Det finnes ingen statistikk for bruken av denne.

Bokhylla.no vil innen 2017 inneholde omlag 250 000 bøker som er utgitt i Norge til og med år 2000. Teksten er indeksert og søkbar. Dataene er derimot ikke maskinlesbare, og er kun tilgjengelige for norske IP-adresser. Bokhylla er dermed ikke å anse som åpne data. Begrensningene for det rettighetsbeskyttede materialet dikteres av avtalen Nasjonalbiblioteket har gjort med rettighetshaverne.

Bruk av åpne forvaltningsdata

Museumsstatistikken er et eksempel på forvaltningsdata som brukes i økende grad. I tillegg til at statistikken brukes av forvaltningen selv, publiserer Statistisk sentralbyrå museumsstatistikk og bruker tallene videre i sin egen presentasjon av kulturstatistikken. Det private forskningsinstituttet Telemarksforsking er også i gang med å lage en database over museumstatistikken, basert på rådata levert fra Norsk kulturråd. Rådgivningsselskapet Rambøll utarbeider en oversikt over visuell kunst i tall og bruker tall fra museumsstatistikken som en del av bakgrunnsmaterialet.

Nasjonalbiblioteket har ansvar for å samle og presentere den norske bibliotekstatistikken. Her finnes et åpent datasett som viser årlig bestand, tilvekst og bruk av alle fag- og forskningsbibliotek, folke- og fylkesbibliotek i Norge.

Arkivverket, Nasjonalbiblioteket og Norsk kulturråd samler og publiserer statistikkene på henholdsvis arkiv-, bibliotek- og museumsfeltet. De tre statistikkene overlapper til en viss grad på hvilke institusjoner som leverer tall. De har også berøringspunkter der typene materiale i samlingene overlapper. Det er etablert en møteplass for koordinering av spørreskjema, utveksling av erfaringer og diskusjon av arbeidet. Statistiske data fra de tre sektorene bør kunne publiseres som åpne data, og gjerne også med lenking av institusjoner, geografi, material- og samlingstyper.

Hvilke data er etterspurt men ikke tilgjengelige i dag?

Data fra Norsk kulturråds søknadsforvaltning er etterspurt både fra media, forvaltning og forskning (evaluerings- og utredningsprosjekter). Det finnes ingen statistikk over denne etterspørselen, men den oppfattes som relativt stabil de siste årene. Det vanligste er forespørsler om en konkret region eller kategori, og da om hvem som har søkt, hva de har søkt om (både prosjekt og sum) og om de har fått tilskudd eller ikke. Slike data må i dag i stor grad hentes ut og tilgjengeliggjøres manuelt på forespørsel.

Det er generelt stor etterspørsel etter diverse samlingsinnhold i Arkivverket, Nasjonalbiblioteket og museene som ikke er digitalisert eller digitalt tilgjengeliggjort. Eksempler på populære materialtyper er aviser, tidsskrifter, kart, tegninger og foto. Noe av dette materialet, primært aviser og tidsskrifter, er ikke tilgjengeliggjort grunnet komplekse og uavklarte rettighets- og avtaleforhold.

All tekst som digitaliseres i Nasjonalbiblioteket OCR-behandles 18 . Denne tekstgjenkjenningen gjør det mulig å søke på ord og fraser i en scannet bok, en avis eller et tidsskrift. OCR-teksten er dessuten etterspurt av brukere med synshemming eller lesevansker, fordi den kan brukes på leselist og til å generere syntetisk tale. Slike løsninger støter imidlertid på en del utfordringer. Kvaliteten på OCR-teksten bestemmer leseopplevelsen, og materiale som er dekket av avtaler med rettighetshavere er ikke uten videre nedlastbart.

Har tilgjengeliggjøringen gitt nye tjenester?

Tilgjengeliggjøringen av åpne kulturdata har så langt gitt flere nye tjenester. Tjenestene er utviklet gjennom intern bruk av APIer (Digitalarkivet på mobil og Historisk befolkningsregister i Arkivverket), gjennom samarbeidsprosjekter som Kultur- og naturreise eller på direkte initiativ fra eksterne interessenter. De viktigste kjente brukerne, dvs. løsningene/tjenestene som bruker åpne kulturdata frermgår av tabellen nedenfor:

Tjeneste / løsning

Tema

Utvikler

Data som inngår

Kultursøk

Innsyn; søke i flere samlinger

Webløft; Buskerud fylkesbibliotek

Norvegiana, NBdigital, folkebibliotekkataloger m.m.

Kultursøk

Innsyn; søke i flere samlinger

Regionale kulturnett

Norvegiana

Norgeskart

Mobilapplikasjon; innsyn; søke i flere samlinger

Avinet

Norvegiana, FT 1910

En blå tråd

Innsyn; søke i flere samlinger

Trondheim kommune, byplankontoret

Norvegiana

Kartdemonstratorer

Mobil og nett. Kartvisning av innhold fra flere kilder

Kultur- og naturreise-prosjektet

Norvegiana, og flere andre kilder

KNappen

Mobilapplikasjon

Kultur- og naturreise-prosjektet

Norvegiana, og flere andre kilder

Rallarvegen

Mobilapplikasjon; opplevelser langs Rallervegen

Hordaland fylkeskommune

Norvegiana

Prøysenvandring

Mobilapplikasjon; opplevelser i “Prøysenland”

Hedmark fylkesbibliotek

Norvegiana

Ætteforsker

Mobilapplikasjon

Privat utvikler

Folketelling 1910 og Norvegiana

Stedr

Mobilapplikasjon

Prosjektet TAG CLOUD/Sintef

Norvegiana

Historiske vandreruter

Nett og mobil

Riksantikvaren

Norvegiana

Oslo i gamle dager

Mobilapplikasjon

Privat utvikler

DigitaltMuseum

Nasjonalmuseets samlingssøk

Søk i museets samlinger

Nasjonalmuseet

DigitaltMuseum

Digitalarkivet på mobil

Mobilapplikasjon

Riksarkivet

Digitalarkivet

Søkemotor for bibliotek

Lenkegenerator

Bibliotekarens Beste Venn

NBdigital

Detaljert oversikt og mer informasjon om de enkelte løsningene som bruker data fra Norvegiana er publisert på https://norvegianablog.wordpress.com/losninger-som-bruker-norvegiana-data/ .

Den generelle erfaringen er at tilgjengeliggjøring og bruk påvirker datakvaliteten positivt gjennom brukerkommentarer på feil og nødvendige forbedringer. Gitt at disse blir fulgt opp vil datakvaliteten bli bedre. Nasjonalbiblioteket har som mål å ta i bruk egne APIer internt, bl.a. for å selv kunne finne og rette feil i egne data og dermed heve datakvaliteten raskere.

Fotnoter

18.

Med tradisjonell skanning får du et bilde av den skannede teksten – du kan ikke automatisk markere ord eller avsnitt i teksten. Derfor kan du heller ikke redigere den eller få den lest opp med f.eks CD-ORD. Med OCR-skanning (Optical Character Recognition) ‘låses teksten opp’ slik at den kan markeres.