Retningslinjer ved tilgjengeliggjøring av offentlige data

Å tilgjengeliggjøre offentlige data handler om mer enn å publisere data slik at det er mulig å finne dem på en nettside. Data må gjøres tilgjengelig på en måte som gjør det mulig for brukere å realisere verdien av dem.

Dette betyr at det må være godt beskrevet både hvordan dataene kan brukes (juridisk) og hvordan dataene teknisk er gjort tilgjengelige (format og evt. programmerings­grensesnitt).

Tilgjengeliggjøring av offentlige data er et viktig bidrag til innovasjon, næringsutvikling og åpenhet i samfunnet. Å gi tilgang til offentlige data betyr at næringsliv, forskere, sivilsamfunn og offentlig sektor selv kan gjøre nytte av informasjon offentlig sektor forvalter -  for verdiskaping, økt effektivitet og økt åpenhet og transparens.

Begrepet offentlige data omfatter alle typer informasjon offentlige virksomheter besitter.

Informasjon som er underlagt taushetsplikt, skal ikke tilgjengeliggjøres for viderebruk. Dette gjelder både personlige forhold og forretningshemmeligheter (forvaltningsloven §13). Fødested, fødselsdato, statsborgerskap, sivilstand, yrke, bopel eller arbeidssted regnes i denne sammenheng ikke som personlige forhold, med mindre de kan røpe et klientforhold eller lignende. Generelt skal man være forsiktig med å tilgjengeliggjøre data som kan inneholde personopplysninger, og virksomheten bør gjøre en grundig vurdering opp mot både personopplysningsloven og offentlighetsloven i hvert enkelt tilfelle. I noen tilfeller kan imidlertid samfunnets behov veie tyngre enn den enkeltes rett til privatliv, slik at informasjon som inneholder personopplysninger likevel kan gjøres tilgjengelig for viderebruk. Dette kan for eksempel gjelde for lister over politiske verv, etc.

I noen tilfeller vil personopplysningene kunne anonymiseres, eller data aggregeres, slik at de ikke lenger kan knyttes til identifiserbare enkeltpersoner. Informasjonen vil da kunne tilgjengeliggjøres for viderebruk på vanlig måte.

Retten til innsyn i offentlig informasjon er regulert i offentlighetsloven. Digitaliseringsrundskrivet beskriver enkelte spesielle fellesføringer for tilgjengeliggjøring av offentlige data. For å sikre at tekniske, organisatoriske og juridiske forhold er lagt til rette for best mulig utnyttelse av offentlige data, bør virksomheter som forvalter offentlige data følge disse retningslinjene:

1. Bruk åpne standardlisenser

Data som tilbys skal ha klare vilkår for hvordan de kan brukes. Vilkårene skal åpne for så mange bruksområder som mulig. Dersom data som tilgjengeliggjøres er beskyttet etter åndsverkloven, bør virksomheten si ifra seg sine egne eksklusive økonomiske rettigheter til bruk av datasettet. Dette kan enkelt gjøres ved å bruke åpne standardlisenser som Creative Commons 4.0 Navngivelse Internasjonal (CC BY 4.0) eller Norsk lisens for offentlige data (NLOD). Disse standardlisensene sikrer en helhetlig praksis for hvilke rettigheter brukerne har, og fritar samtidig utgiver for juridisk ansvar knyttet til datakvalitet og hva data blir brukt til.

2. Tilby data gratis

Hovedregelen er at data skal være gratis, og at det ikke er anledning til å ta betalt for kostnader til innsamling og produksjon av data for viderebruk. Det finnes enkelte unntak i offentlighetsloven (§ 8) og -forskriften (§ 4) som gir anledning til å ta betalt for data.

Virksomheter som krever betaling for informasjon, skal offentliggjøre betalingssatsene i elektronisk form. Alle opplysninger om grunnlaget for utregning av betalingssatsene skal også publiseres elektronisk, slik at de er lette å finne for potensielle brukere.

3. Tilby data uten brukerregistering

Data skal i utgangspunktet gjøres tilgjengelig uten at brukeren må søke om tillatelse eller registrere seg. I tråd med bestemmelsene i offentlighetsloven skal data kunne benyttes hvor som helst, av hvem som helst, og til ethvert formål. Brukere bør samtidig oppmuntres til å oppgi kontaktinformasjon, slik at utgiveren kan varsle brukerne for eksempel ved endringer eller driftsavbrudd.

4. Dokumenter datasettene

Virksomhetene bør dokumentere datasettene slik at det blir enkelt å ta datasettene i bruk både for mennesker og maskiner. Med dokumentasjon mener vi beskrivelser som gjør det mulig for andre å oppdage, forstå og bruke dine data.

5. Tilby informasjon om datakvalitet

Kvaliteten på virksomhetens data påvirker hvor egnet de er til andre formål enn de først ble skapt for. Dokumentering av datakvalitet er til stor hjelp i prosessen med å vurdere om virksomhetens datasett er egnet til andre formål, og øker sjansen for bruk. Datakvaliteten bør derfor være dokumentert, og kjente utfordringer bør eksplisitt omtales i beskrivelsene.

6. Tilby oppdaterte data

Virksomheten bør tilby oppdaterte data og være tydelig på hvilken oppdateringsfrekvens som gjelder. Tjenesten som leverer data bør ha et tjenestenivå tilpasset brukernes behov.

7. Gjør data synlige

For at potensielle brukere av offentlige data enkelt skal kunne finne data, bør beskrivelser av datasett være tilgjengelig på data.norge.no, som er en katalog med beskrivelser av datasett fra det offentlige. Digitaliseringsrundskrivet gir anbefalinger om formater for dette formålet i dokumentet Standard for beskrivelser av datasett og datakataloger. Virksomheten bør vurdere å tilby beskrivelser på engelsk i tillegg til norsk.

8. Bruk maskinlesbare og standardiserte formater

Data skal være tilgjengelig i maskinlesbare formater. I tillegg bør formatene være standardiserte. Dette sikrer god samhandlingsevne med annen informasjon (interoperabilitet) og legger ikke unødvendige begrensninger på hva informasjonen kan brukes til i fremtiden. Eksempler på maskinlesbare og standardiserte formater er CSV, XML, JSON og RDF-serialiseringer som RDF/XML, JSON-LD og Turtle.

9. Tilby data gjennom et programmeringsgrensesnitt

Et programmeringsgrensesnitt (API) er en måte å tilby data på som gjør det mulig for annen programvare å gjøre oppslag i hele eller spesifikke deler av virksomhetens data via internett. Det gjør det for eksempel mulig å bruke data i sanntid, filtrere på forespørsel, og å arbeide med data på dataelementnivå uten at brukerne må opprette lokale kopier av datasettene. Et programmeringsgrensesnitt er den beste måten å gjøre data tilgjengelig på dersom datasettene er store, komplekse eller oppdateres ofte. 

10. Tilby komplett nedlasting

Selv om et programmeringsgrensesnitt er en svært fleksibel måte å tilby data på, kan brukerne også ha behov for å laste ned komplette datasett for å etablere lokale kopier. Komplett nedlasting kan tilbys som funksjonalitet i et programmeringsgrensesnitt, eller som en maskinlesbar fil publisert på internett.

11. Bruk faste adresser og unike identifikatorer

Data bør ha unike, permanente og hensiktsmessige adresser på internett, slik at det er mulig å lenke data sammen. Dette gjelder selve datasettet og versjoner og serier av dette, samt datasettets elementer. Data får økt verdi om de refererer til andres data om samme ting, samme sted, samme hendelse, samme person osv. Det betyr at alle bør bruke samme identifikatorer på tvers av datasett, og legge til rette for at egne identifikatorer kan refereres til av andre.

12. Publiser oversikt over virksomhetens data

Hvilke data som tilgjengeliggjøres bør være drevet av brukernes behov. For at brukerne skal kunne finne og bruke dine data, må de vite hvilke data du har. Virksomheten bør derfor vedlikeholde og publisere en oversikt over hvilke data de forvalter. Dette gjelder også beskrivelser av datasett som av forskjellige grunner ikke er tilgjengeliggjort.

13. Tilpass data til brukernes behov

Virksomhetene bør tilpasse data slik at brukere enkelt kan ta dem i bruk, for eksempel ved å lage systemer for spørringer som er tilpasset spesifikke formål. Slike tilpasninger bør likevel ikke være til hinder for at datasett også blir gjort tilgjengelig i sin opprinnelige form, dersom dette blir etterspurt. Her er det viktig at virksomhetene er åpne for innspill fra de som ønsker å bruke datasettene.

14. Oppmuntre til bruk

Å gjøre data åpent tilgjengelig er ikke nok for at data skal bli brukt. Utgivere bør samhandle med brukerne og aktivt oppmuntre til bruk av deres data.

15. Legg til rette for tilbakemeldinger

Gjennom å tilby brukerne muligheten for å gi tilbakemeldinger, vil virksomheten ha bedre forutsetninger for å forstå behovene til brukerne. Dette vil bidra til å forbedre kvaliteten på publiserte data og til å bygge tillit mellom utgiveren og brukerne.