Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata

Til innholdsfortegnelse

1 Sammendrag

1.1 Forskningsdata bør deles og gjenbrukes mer

Digitaliseringen bringer med seg forandringer i forskningen. Arbeidsprosesser endres og det åpner seg nye muligheter for å bedre forskningskvaliteten og øke den kunnskapsintensive verdiskapingen. Bedre tilgjengeliggjøring og mer gjenbruk av forskningsdata kan bidra til vitenskapelige fremskritt ved at hver enkelt forsker får et større datagrunnlag å bygge på, til økt etterprøvbarhet og bedre kvalitetssikring av tidligere forskningsfunn, og til å unngå at samme type datainnsamling må finansieres flere ganger. En sterkere delingskultur gjør det mulig for studenter å arbeide med interessante og aktuelle data og bidra til forskningen. Bedre tilgang til forskningsdata kan bidra til innovasjon og verdiskaping ved at andre aktører enn forskere kan se nye bruksområder. Det kan bidra til smartere tjenesteutvikling i offentlig sektor, muligheter for ny næringsvirksomhet og flere arbeidsplasser. Et selvstendig og viktig poeng er at større åpenhet og bedre innsyn i forskningen kan bidra til å styrke tilliten til forskere og til forskningsresultater.

For å bedre tilgjengeligheten og øke gjenbruken av forskningsdata trenger forskere kompetanse og verktøy til å håndtere data på en god og sikker måte i alle ledd av forskningsprosessen. De må kunne finne og få tilgang til relevante data blant eksisterende kilder. De må ha infrastruktur både for innsamling, analyse, arkivering og deling av data, og tilgang til oversiktlig informasjon om denne. Infrastrukturen må legge til rette for samarbeid og kunnskapsdeling på tvers av land og sektorer. Norske datasett bør være enkle å finne for internasjonale forskere. Brukergrupper i næringslivet eller i forvaltningen vil ha en del behov som sammenfaller med forskernes. For at en sterk åpenhetskultur skal kunne kombineres med en trygg ivaretakelse av viktige skjermingshensyn, for eksempel knyttet til personvern, må ressurser og oppmerksomhet rettes både mot tekniske aspekter ved databehandling og mot etiske, juridiske og administrative forhold.

Denne strategien skal bidra til å øke forskningskvaliteten og den kunnskapsintensive verdiskapingen gjennom å fastslå grunnprinsipper for håndtering og tilrettelegging av offentlig finansierte forskningsdata, klargjøre forventninger til forskningsinstitusjonene og presentere tiltak som legger bedre til rette for å bygge på tidligere arbeider og sammenstille forskningsdata på nye måter.

Strategiens del 1 handler om å øke tilgjengeligheten til og gjenbruken av offentlig finansierte forskningsdata. Her beskrives policystatus og status ved forskningsinstitusjonene. Tre grunnprinsipper for hvordan forskningsdata skal tilrettelegges og deles fastslås. I tillegg beskrives de viktigste barrierene mot tilgjengeliggjøring og gjenbruk av forskningsdata med tilhørende tiltak. Det pekes på behov for kulturendring, økt kompetanse, datahåndteringsplaner, bedre teknisk tilrettelegging, bedre faglig samordning nasjonalt og bærekraftige finansieringsmodeller.

Strategiens del 2 handler om forskeres tilgang til offentlige data som utgjør viktige datakilder for forskning. Problemstillingen omtales generelt, og to viktige områder behandles spesielt. Det første dreier seg om forskeres tilgang til registerdata hos Statistisk sentralbyrå. Det andre dreier seg om deres tilgang til data fra helseregistre, biobanker og helseundersøkelser.

Strategien omfatter ikke forskningsdata fra privat finansiert forskning og utviklingsarbeid. I tilfeller der private aktører mottar offentlig støtte til forskning eller samarbeider med offentlige forskningsinstitutter, universiteter, høyskoler og helseforetak i forsknings- og innovasjonsprosjekter som er offentlig finansiert, åpner grunnprinsippene (se 1.4) for at data kan skjermes for å beskytte forretningshemmeligheter eller når det er nødvendig for å kommersialisere resultatene. Det kan likevel finnes tilfeller der private aktører finner det ønskelig å dele sine data. Effektivitets- og soliditetshensynene vil også gjøre seg gjeldende for private, som kan finne det hensiktsmessig å spre risiko og gå sammen om investeringer i data som deles, og konkurrere på bruken av data heller enn på tilgangen til data. Dette vil det være opp til private aktører å vurdere fra tilfelle til tilfelle. Strategiens prinsipper, virkemidler og oppfølging kan følgelig være relevante også for private aktører. Virkemidler som informasjon, standarder og verktøy for åpne data kan gjøres tilgjengelig på fritt grunnlag og også finnes relevante for private. Sist, men ikke minst, er næringslivet tjent med at offentlig finansierte forskningsdata gjøres mer åpent tilgjengelige, at forskningsresultater er så robuste som mulig, og at offentlige forskningsmidler utnyttes effektivt.

Strategien er en oppfølging av Meld. St. 27 (2015–2016) Digital agenda for Norge – IKT for en enklere hverdag og økt produktivitet. For å øke tilgjengeligheten til åpne offentlige data sluttet Stortinget seg til at det skal utarbeides strategier eller handlingsplaner for fem sektorer som er funnet spesielt samfunnsøkonomisk verdifulle. Disse sektorene er kultur, statlige utgifter, transport og samferdsel, kart og eiendom (geodata) i tillegg til forskning.

Utviklingen går fort, og det er mye vi ikke vet om hvordan økt digitalisering og mer datadeling vil påvirke forskningen og dens rammebetingelser. Strategien gjelder derfor for perioden 2018-2021. Deretter vil den bli vurdert på egnet måte, før den eventuelt rulleres i tråd med nye erfaringer og økt kunnskap.

Innledningsvis klargjøres definisjoner, og det gis en sammenfatning av strategiens grunnprinsipper, forventninger og tiltak, før nærmere begrunnelser og utdyping gis i de påfølgende delene.

1.2 Hva menes med offentlig finansierte forskningsdata?

I denne strategien refererer offentlig finansierte forskningsdata til:

(i) data som er samlet inn eller frembrakt til bruk for eller som et resultat av offentlig finansiert forskning, og

(ii) data som utgjør grunnlaget for publikasjoner som er et resultat av offentlig finansiert forskning, uavhengig av hvilken kilde dataene kommer fra.

Figur 1.1 Datakretsløpet i forskning

Med offentlige data menes all informasjon som offentlige organer produserer, samler inn eller betaler for. Slike data kan være både åpne og lukkede. Mange av disse dataene er ikke samlet inn primært for forskning, men de kan utgjøre viktige datakilder for forskning.

1.3 Hva menes med gjenbruk?

Politikken for tilgjengeliggjøring av offentlige data i Norge er beskrevet i Meld. St. 27 (2015–2016) ­Digital agenda for Norge — IKT for en enklere hverdag og økt produktivitet. Her brukes uttrykkene gjenbruk og viderebruk. Gjenbruk innebærer at offentlige virksomheter skal gjøre bruk av de dataene som det offentlige alt har, i stedet for å spørre brukerne på nytt om forhold de allerede har opplyst om. Dette omtales som prinsippet om «kun én gang» (kapittel 7). Viderebruk handler om å gi forskere, næringsliv og sivilsamfunnet tilgang til offentlige data på en måte som gjør at de kan brukes i nye sammenhenger også utenfor offentlig sektor (kapittel 14.2). All bruk vil være underlagt de generelle normene og reglene for kreditering, personvern, taushetsplikt mv. For denne strategiens formål er ikke skillet mellom gjenbruk og viderebruk og mellom offentlig og privat sektor viktig, og ordet gjenbruk betegner all slags videre bruk av forskningsdata, uavhengig av sektor.

1.4 Grunnprinsipper

Denne strategien slår fast følgende tre grunnprinsipper for offentlig finansierte forskningsdata i Norge:

Grunnprinsipp 1: Forskningsdata skal være så åpne som mulig, så lukkede som nødvendig. Dersom ingen legitime hensyn står i veien, skal forskningsdata tilrettelegges for åpen tilgang. Hensynet til sikkerhet, personvern, immaterielle rettigheter, forretningshemmeligheter o.l. tilsier i en del tilfeller at forskningsdata ikke kan gjøres helt åpent tilgjengelige. En del slike forskningsdata kan likevel gjøres tilgjengelige for bestemte brukere etter bestemte kriterier for tilgang. Behovet for skjerming kan også endre seg over tid, slik at dataene kan gjøres tilgjengelige på et senere tidspunkt.

Grunnprinsipp 2: Forskningsdata bør håndteres og tilrettelegges slik at verdiene i dataene kan utnyttes best mulig. Forskningsdata må håndteres slik at de er søkbare og gjenfinnbare og, der det er aktuelt, tilrettelegges slik at de er reelt gjenbrukbare. Det vil blant annet si at de må utstyres med gode metadata og med en lisens som gjør det klart hvordan dataene kan eller eventuelt ikke kan brukes. Forskningsdata skal gjøres tilgjengelig til lavest mulig pris og på like vilkår for alle brukergrupper som oppfyller kriterier for tilgang.

Grunnprinsipp 3: Beslutninger om arkivering og tilrettelegging av forskningsdata må tas i forskerfellesskapene. Forskere inngår i fellesskap, lokalt sammen med sine institusjonsledere, nasjonalt og internasjonalt, der god forskningsskikk, herunder datadeling, utvikles kontinuerlig. Fordi det er ressurskrevende å tilrettelegge forskningsdata for gjenbruk, er det viktig med gode kost-nytte-vurderinger av hvilke data det gir merverdi for samfunnet å bruke ressurser på å tilrettelegge. Myndighetene kan ikke gi retningslinjer for hvilke data som skal arkiveres, og i hvilken grad de skal tilrettelegges for gjenbruk. Slike vurderinger og beslutninger må tas av dem som har det nærmeste ansvaret for dataene. Det er liten tvil om at også forvaltningen og næringslivet vil kunne ha stor nytte av at forskningsdata gjøres tilgjengelige for gjenbruk. Forskningsmiljøene må også ta hensyn til denne nytten når de vurderer kostnad opp mot nytte ved å tilrettelegge for gjenbruk.

1.5 Forventninger og tiltak

Kulturendring, insentiver og kompetanse

For at forskere skal kunne tilgjengeliggjøre og dele forskningsdata mer, må barrierer reduseres i form av gode støttetjenester, informasjon, opplæring og insentiver. For å understøtte en ønsket kultur­endring der datatilretteleggingsarbeid i større grad anerkjennes og krediteres ved søknader om forskningsfinansiering og stillinger, må det legges til rette for at datasett kan siteres, og for at arbeid med forskningsdata synliggjøres bedre.

Regjeringen forventer

  • at forskningsinstitusjonene bidrar til å heve kompetansen hos ansatte og studenter gjennom opplæring i datahåndtering og gjenbruk av data
  • at utdanningsinstitusjonene vurderer nasjonalt og nordisk samarbeid med henblikk på behovet for å etablere utdanningstilbud for håndtering av forskningsdata (datarøktere o.l.)

Regjeringen vil

  • be det nye organet for høyere utdannings- og forskningstjenester om å formidle informasjon om gjeldende krav, regelverk og ressurser knyttet til håndtering av forskningsdata
  • gi det nye organet for høyere utdannings- og forskningstjenester koordineringsansvar for å vurdere hvordan nasjonale forskningsdataarkiver best kan tilby opplæring av forskere og studenter om egne tjenester
  • be det nye organet for høyere utdannings- og forskningstjenester om å tilrettelegge for sitering av datasett og kreditering av dataarbeid gjennom utstedelse av permanente identifikatorer (DOI-nummer) og digital forsker-ID (ORCID)
  • be det nye organet for høyere utdannings- og forskningstjenester om å utarbeide statistikk for å synliggjøre etablering og gjenbruk av forskningsdata

Krav om datahåndteringsplaner

Forskere møter økte krav og forventninger knyttet til håndteringen av forskningsdata fra tidsskrifter, forskningsfinansiører og egne institusjoner. Fra 2017 er åpen tilgang til forskningsdata og krav om datahåndteringsplaner standard i EUs forsknings- og innovasjonsprogram Horisont 2020. I sin oppdaterte policy for tilgjengeliggjøring av forskningsdata krever Norges forskningsråd at godkjente datahåndteringsplaner skal foreligge ved kontraktsinngåelse for prosjekter som genererer data. Dette krever gode prosedyrer og retningslinjer ved den enkelte forskningsinstitusjon.

Regjeringen forventer

  • at forskningsinstitusjonene utvikler prosedyrer for (i) godkjenning av datahåndteringsplaner og (ii) beslutninger om at et forskningsprosjekt eventuelt er av en slik art at egen datahåndteringsplan ikke er nødvendig eller hensiktsmessig

Regjeringen vil

  • be Norges forskningsråd gjøre godt kjent sitt krav om at en datahåndteringsplan godkjent av forskningsinstitusjonen skal foreligge ved kontraktsinngåelse, der dette er relevant
  • be Norges forskningsråd fortsette å være en pådriver nasjonalt og internasjonalt for bedre tilgjengeliggjøring og gjenbruk av forskningsdata
  • be forskningsinstitusjonene om å utvikle retningslinjer for forskningsdata som skal lagres, tilgjengeliggjøres og tilrettelegges, med angivelse av hvilke løsninger som bør benyttes for håndtering av ulike datasett
  • be det nye organet for høyere utdannings- og forskningstjenester bidra til at tjenestetilbydere av nasjonale forskningsdataarkiver samordner seg og, i samarbeid med forskningsinstitusjonene, bidrar til at løsninger som utvikles for datahåndteringsplaner er mest mulig kompatible, og følger internasjonale standarder

Bedre teknisk tilrettelegging og bedre faglig samordning nasjonalt

Det er behov for større grad av samordning mellom tilbydere av nasjonale forskningsdataarkiver, slik at tjenestene fremstår oversiktlige for brukerne. Det bør finnes en samlet oversikt med informasjon om norske forskeres publikasjoner og datasett. For at forskningsdata skal være gjenfinnbare og gjenbrukbare på tvers av ulike IKT-systemer, kreves bedre teknisk tilrettelegging og gode metadata som følger internasjonale standarder.

Regjeringen forventer

  • at forskningsinstitusjoner, forvaltere av forskningsdatainfrastrukturer og fagmiljøer bidrar til standardisering og harmonisering som muliggjør deling og gjenbruk av data i henhold til internasjonale standarder og god skikk innenfor ulike fagområder (for eksempel gjennom å etablere fagområdespesifikke nasjonale kommunikasjonsarenaer)

Regjeringen vil

  • be det nye organet for høyere utdannings- og forskningstjenester om å bidra til informasjon om nasjonale forskningsdataarkiver og -tjenester, slik at tjenestene fremstår samlet og lett tilgjengelige for alle forskere og forskningsutførende institusjoner
  • be det nye organet for høyere utdannings- og forskningstjenester ta ansvar for å utrede hvordan et nasjonalt vitenarkiv skal realiseres

Bærekraftig finansiering og drift av nasjonale forskningsdatainfrastrukturer og forskningsdataarkiver

Det finnes en rekke mulige finansieringskilder for infrastrukturer for lagring og tilgjengeliggjøring av forskningsdata. Det er imidlertid ikke alltid klart hvilke finansieringsmodeller som vil fungere mest effektivt for å ivareta langsiktig og bærekraftig drift i hvert enkelt tilfelle. I tillegg til særskilte finansieringsvirkemidler for etablering av infrastruktur er det behov for kunnskap om hvordan ulike inntekter og kostnader knyttet til arbeidet med forskningsdata kan kombineres i effektive og bærekraftige forretningsmodeller.

Regjeringen forventer

  • at det der det er hensiktsmessig utvikles selvbetjeningsløsninger for å redusere kostnader ved drift av forskningsdatainfrastrukturer gjennom å forenkle prosesser for deponering av og tilgang til forskningsdata og metadata

Regjeringen vil

  • videreføre Norges forskningsråds ordning Nasjonal satsing på forskningsinfrastruktur
  • be Norges forskningsråd, i samarbeid med det nye organet for høyere utdannings- og forskningstjenester og med representanter fra forskningsinstitusjonene, om å utrede og gi råd om bærekraftige finansieringsmodeller for drift av forskningsdatainfrastrukturer og forskningsdataarkiver

Bedre tilrettelegging for bruk av offentlige data til forskning

Datasett generert av ulike offentlige aktører kan ha stor relevans for forskning, blant annet ulike typer registerdata. Noen av disse datasettene er åpne og lett tilgjengelige for forskere, mens tilgang til andre datasett kan være begrenset av en rekke ulike årsaker. Det kan skyldes tekniske forhold, at dataene inneholder opplysninger som tilsier hel eller delvis skjerming eller kostnader knyttet til bearbeiding før de kan gjøres tilgjengelige. Det er et mål at det skal bli enklere for forskere å få tilgang til denne type data.

Regjeringen vil

  • be offentlige aktører legge til rette for gjenbruk av data til forskning, innovasjon og verdiskaping ved oppgradering og utvikling av systemer for datalagring
  • legge vekt på tilgang til data for forskning i arbeid med relevante lov- eller forskriftsendringer

Bedre samspill mellom offentlige data og forskningsdata

Arkiverte og gjenfinnbare forskningsdata representerer verdier som kan styrke den offentlige forvaltningen og dermed gi bedre tjenester tilbake til samfunnet. Det er behov for større grad av nasjonal koordinering for at arkivverdige forskningsdata lagres og håndteres på en slik måte at de i størst mulig grad kommer offentlig forvaltning til gode. Dette krever dialog mellom forskersamfunnene, representanter fra offentlig forvaltning og de som eier og/eller drifter nasjonale infrastrukturer for lagring av både forsknings- og forvaltningsdata.

Regjeringen vil

  • vurdere å etablere et nasjonalt forum for gjenbruk av forskningsdata med representasjon fra relevante offentlige organer for å få råd i spørsmål om samordning, datakvalitet, tilgangsstyring, rutiner og finansiering av nasjonale datainfrastrukturer som skal betjene både forskere, forvaltere, næringsliv og innbyggere

Enklere tilgang til data fra Statistisk sentralbyrå for forskningsformål

En av Statistisk sentralbyrås (SSBs) oppgaver er å gi opplysninger til statistisk bruk for forskningsformål, innenfor rammene av blant annet personvern og statistisk konfidensialitet. Data fra SSB inngår i en rekke forskningsprosjekter. Det er et mål at denne strategien skal bidra til at det blir enklere å få tilgang til SSB-data til forskningsformål.

Regjeringen forventer

  • at forskningsinstitusjonene bidrar til bedre bestillerkompetanse hos egne forskere og støttepersonell

Regjeringen vil

  • utrede en finansieringsmodell for tilgang til data fra Statistisk sentralbyrå til forskning som ivaretar både hensynet til en effektiv bruk av ressurser på datatilgangen og samfunnsmessige gevinster av forskningen
  • støtte opplæringstiltak for forskere og støttepersonell i regi av Statistisk sentralbyrå
  • vurdere forslag fra Statistikklovutvalget og innspill fra høringen med sikte på å bedre forskeres tilgang til data fra Statistisk sentralbyrå

Enklere og sikrere tilgang til helsedata

Norge har et omfattende kunnskapsgrunnlag i ulike typer helsedata bygget opp over lang tid, blant annet gjennom nasjonale helsetjenester. I regjeringens handlingsplan for oppfølging av HelseOmsorg21-strategien legges det vekt på å gjøre helsedata lettere tilgjengelig for forskning. Helsedatautvalget ble oppnevnt for å gi anbefalinger om et bedre og mer effektivt system for behandling av helsedata for statistikk, planlegging, helseanalyser, kvalitetsforbedring, forskning, innovasjon og næringsutvikling. Utvalget har anbefalt tiltak for å gjøre tilgangen til helsedata enklere og sikrere.

Regjeringen forventer

  • at databehandlingsansvarlige for helseregistre og Statistisk sentralbyrå gjennom Helsedataprogrammet bidrar til at data i større grad skal kunne analyseres sikkert og effektivt på tvers av datakilder

Regjeringen vil

  • vurdere forslagene fra Helsedatautvalget og innspill fra høringen med sikte på å etablere et enklere og sikrere system for tilgang til helsedata
  • vurdere etablering av en plattform for helse­analyser, jf. oppdrag til Direktoratet for e-helse om å utrede etablering av en slik plattform

Del 1 Data som er samlet inn eller frembrakt som et resultat av offentlig finansiert forskning

Til forsiden