Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata

Til innholdsfortegnelse

2 Status

2.1 Overordnet IKT-politikk og åpne offentlige data internasjonalt og nasjonalt

Økt tilgang til offentlige data, inkludert forskningsdata, er viktig for effektivisering, innovasjon, næringsutvikling og et åpent og demokratisk samfunn.

Europakommisjonen definerer offentlige data som all informasjon som offentlige organer produserer, samler inn eller betaler for. Eksempler er geografisk informasjon, statistikk, værdata, data fra offentlig finansierte forskningsprosjekter eller digitaliserte bøker fra biblioteker.

EUs viderebruksdirektiv 2003/98/EC (“PSI-direktivet”) gir det lovmessige rammeverket for tilgang til offentlige data. Direktivet bygger på to av grunnpilarene i EUs indre marked: transparens og rettferdig konkurranse. I tillegg ønsker Kommisjonen å sikre mer effektiv utnyttelse av denne typen data over landegrensene. Direktivet ble revidert i 2013 (2013/37/EU) og omfatter nå også arkiver, biblioteker og museer, samt rett til å få utlevert data i maskinlesbare formater (dersom dette eksisterer). Direktivet gjelder tekstdokumenter, databaser, lydfiler og filmklipp, men omfatter ikke områdene utdanning, forskning og kringkasting. Direktivet inneholder bestemmelser om ikke-diskriminering, gebyrer, avtaler om enerett, gjennomsiktighet, lisenser og praktiske redskaper som kan lette registrering og viderebruk av offentlige data.1 EUs viderebruksdirektiv er implementert i viderebruksbestemmelsene i offentlighetsloven.

Norsk politikk for tilgjengeliggjøring av offentlige data er beskrevet i Meld. St. 27 (2015–2016) Digital agenda for Norge — IKT for en enklere hverdag og økt produktivitet. Regjeringen har videre gitt føringer for gjenbruk og viderebruk av offentlige data i Retningslinjer ved tilgjengeliggjøring av offentlige data.2 En sammenstilling av pålegg og anbefalinger finnes i Digitaliseringsrundskrivet.3 Dette gjelder for departementene, statens ordinære forvaltningsorganer, forvaltningsorganer med særskilte fullmakter og forvaltningsbedrifter.

Digital agenda fastsetter at den enkelte virksomhet skal ha oversikt over hvilke data den håndterer, hva dataene betyr, hva de brukes til, hvilke ­prosesser de inngår i og hvem som kan bruke dem. Dette innebærer å ta stilling til hvilke data som kan gjøres tilgjengelig for gjen- og viderebruk. Rundskrivet slår også fast at virksomhetene skal gjøre egnet informasjon tilgjengelig i maskinlesbare og helst standardiserte formater, fortrinnsvis ­gjennom maskinelle grensesnitt (API-er).

Regjeringens Retningslinjer ved tilgjengeliggjøring av offentlige data består av 15 punkter, og skal sikre at tekniske, organisatoriske og juridiske forhold er lagt til rette for en best mulig utnyttelse av offentlige data. Retningslinjene innebærer at bruksvilkårene skal åpne for så mange bruksområder som mulig (gjennom åpne standardlisenser), at data som hovedregel skal være gratis, og at datasettene og datakvaliteten bør dokumenteres.

Allmennheten har innsynsrett i offentlige dokumenter og registre, inkludert data i maskinlesbare formater, innenfor de unntakene som følger av offentlighetsloven. Dette kan beskrives som en reaktiv åpenhet, der innsyn forutsetter at allmennheten har tilstrekkelig kunnskap til å stille relevante innsynskrav. Digitaliseringsrundskrivet legger opp til en proaktiv åpenhet, der egnet informasjon skal gjøres enkelt tilgjengelig.

2.2 Åpen tilgang til forskningsdata internasjonalt og nasjonalt

På overordnet nivå har det vært enighet om prinsipper og retningslinjer for åpen tilgang til offentlig finansierte forskningsdata i over ti år. I 2006 anbefalte Rådet i OECD prinsipper og retningslinjer for tilgang til offentlig finansierte forskningsdata for å bidra til økt kvalitet og effektivitet i forskning, der dette balanseres mot behov for å skjerme data for å beskytte sosiale eller økonomiske interesser.4 Prinsippene omfatter blant annet at data bør gjøres tilgjengelig på like vilkår og til lavest mulig kostnad, og at systemer og betingelser for tilgang må ivareta alle legitime interesser, inkludert lovmessig beskyttelse av nasjonal sikkerhet, personvern, immaterielle eiendeler og forretningshemmeligheter. Videre omtaler prinsippene krav til datahåndteringen. Den må følge relevante tekniske standarder og kvalitetskrav, systemene må fungere kostnadseffektivt, de må være mulig å opprettholde over tid og fleksibelt kunne tilpasses teknologiske og andre endringer. Norge sluttet seg til OECDs anbefalinger og retningslinjer for tilgang til forskningsdata gjennom Stortingets behandling av St.meld. nr. 30 (2008–2009) Klima for forskning.

Europakommisjonen har under overskriften «Det indre digitale marked» satt blant annet åpen forskning tydelig på den politiske dagsordenen (Open Science, Open Innovation, Open to the World).5 Det europeiske rådet vedtok ambisiøse rådskonklusjoner om åpen forskning i mai 2016. Her uttrykte Europas forskningsministre støtte til Kommisjonens mål om at forskningsdata som er fremkommet gjennom finansiering fra Horisont 2020, som hovedregel skal være åpne med mindre sikkerhetshensyn, personvernhensyn, kommersielle hensyn eller andre legitime hensyn tilsier noe annet. Rådet ber Kommisjonen arbeide for å fremme god dataforvaltning, inkludert opplæring og økt bevissthet, og om å implementere datahåndteringsplaner som en integrert del av forskningen. Rådet oppfordrer også landene om å utarbeide nasjonale datadelingsstrategier og om å implementere datahåndteringsplaner som standard vitenskapelig praksis i nasjonale forskningsprogrammer. Rådet understreker videre at data må være gjenfinnbare og gjenbrukbare, jf. punkt 3.2 om de såkalte FAIR-prinsippene, og minner om betydningen av langsiktig arkivering og kuratering av forskningsdata, og om at metadata må være basert på internasjonale standarder.6 Kostnader til datahåndtering og klargjøring av data for deling er støtteberettiget i Horisont 2020. Det er etablert flere rådgivende ekspertgrupper, blant annet Open Science Policy Platform (OSPP) og ekspertgruppen for den europeiske forskningsskyen European Open Science Cloud (EOSC).7

EOSC er en del av det europeiske initiativet som ble presentert av Europakommisjonen i april 2016. Forskningsskyen er tenkt som et interessentdrevet virtuelt miljø av tjenester for lagring, håndtering, analyse og gjenbruk av forskningsdata på tvers av landegrenser og fagområder. Forskningsskyen er tenkt bygget på:

  • integrering og konsolidering av e-infrastrukturplattformer (som GÉANT, EGI, PRACE o.l., se tekstboks 2.1)
  • en føderasjon av eksisterende forskningsinfrastruktur og forskningsskyer (som dataintensive ESFRI8 forskningsinfrastrukturer)
  • utvikling av skybaserte programvaretjenester for åpen forskning

Viktige europeiske e-infrastrukturplattformer

E-infrastruktur for forskning er IKT-baserte infrastrukturer som muliggjør avansert og samarbeidsorientert forskning. E-infrastruktur omfatter regneressurser for store beregninger (tungregning), lagringsressurser, høykapasitets datanettverk og tilhørende tjenester, som autentisering og autorisering, verktøy for effektiv arbeidsflyt og programvare for simulering og analyse av data. Begrepet e-infrastruktur benyttes også om digitale registre og databaser, samt verktøy og tjenester for å sikre og gjøre disse tilgjengelige.

E-vitenskap betegner nye modeller, metoder, algoritmer og programvare rettet mot beregnings- og dataintensive vitenskapelige problemstillinger.

GÉANT (Gigabit European Academic Network): leverer høykvalitets nettverkstjenester utenfor «det vanlige internettet» for internasjonale brukere fra FoU-miljøer. Tjenester inkluderer for eksempel IP-nettverk med høy hastighet, skytjenester, VPN-tjenester, virtuelle testområder og et stort Wi-Fi som gir 50 millioner studenter i over 70 land tilgang gjennom en enkel tilgangsprotokoll. UNINETT Sigma2 representerer Norge som et assosiert nettverk.

EGI (European Grid Initiative): forening av mer enn 300 leverandører av data- og skytjenester i Europa (delvis også fra ikke-europeiske land). EGI tilbyr tjenester på forskjellige anvendelsesområder for forskning og innovasjon, som for eksempel skyregning, høyhastighetsberegning, datalagringstjenester, operasjonell løsningsutvikling og støttefunksjoner. Man kan få tilgang til ressursene på ulike måter: gratis søknadsbasert tilgang ut fra prosjektkvalitet, kjøp av medlemskap eller betaling av engangspris for ønsket tjeneste.

PRACE (Partnership for Advanced Computing in Europe): europeisk forskningsinfrastruktur for tungregningsressurser distribuert i Frankrike, Tyskland, Italia, Spania og Sveits. Infrastrukturen har 25 medlemsland, som også tilbyr lokale tungregningstjenester i sine land. Norge er medlem i PRACE, der UNINETT Sigma2 har ansvar for Norges deltagelse. Forskere kan få tilgang til PRACE tungregningsressurser etter søknad (frist to ganger i året), der det kun er kvaliteten på den planlagte forskningen som vurderes.

I 2016 beregnet Europakommisjonen kostnaden for implementering av forskningsskyen til 6,7 milliarder euro. Kommisjonen har antydet at den vil investere omkring 2 milliarder euro i forskningsskyen, hovedsakelig gjennom Horisont 2020 og EUs neste rammeprogram for forskning og innovasjon. Kommisjonen forventer at resten finansieres gjennom nasjonale offentlige og private investeringer.

På nordisk nivå har landene særlig samarbeidet om tilgang til forskningsdata gjennom Nordforsk. NordForsk har utviklet og støttet samarbeid om såkalt e-infrastruktur og e-vitenskap (se boks 2.1) gjennom initiativene Nordic e-Infrastructure Collaboration (NeIC) og The Nordic eScience Globalisation Initiative (NeGI). NordForsk har også bidratt til samarbeid om data mellom nordiske statistikkmyndigheter og mellom de nordiske meteorologiske instituttene.

Norges forskningsråd har fra 2000 stilt krav gjennom sine «Generelle vilkår for FoU-prosjekter» om at forskningsdata skal arkiveres på forsvarlig måte i minimum ti år. I 2014 vedtok Forskningsrådet en policy for tilgjengeliggjøring av forskningsdata. Der slås det fast at Forskningsrådet vil sikre at søknader inneholder planer for datahåndtering der det er relevant, og sørge for at disse blir fulgt opp som en del av ordinær prosjektoppfølging. Forskningsrådet oppdaterte sin policy høsten 2017, se nærmere omtale i punkt 4.2.

Bedre tilgang til forskningsdata må ses i sammenheng med utviklingen når det gjelder åpen tilgang til forskningsresultater. Regjeringen har som mål at alle norske vitenskapelige artikler finansiert av offentlige midler skal være åpent tilgjengelige innen 2024, og la i august 2017 frem retningslinjer og tiltak som skal å bidra til at målet nås.9

2.3 Personvern og rettigheter til data

All gjenbruk av forskningsdata og andre offentlige data som er viktige datakilder for forskning vil være underlagt de generelle reglene om personvern, taushetsplikt osv. Hensynet til sikkerhet, immaterielle rettigheter, forretningshemmeligheter o.l. må også ivaretas. Gjenbruk endrer ikke på ansvaret for de som utleverer data, bruker data og/eller lagrer data. I tillegg kommer ansvaret for å følge forskningsetiske normer. Etter forskningsetikkloven av 2017 ligger dette ansvaret både på den enkelte forsker og på forskningsinstitusjonene.

Personvern

En del forskningsdata inneholder personopplysninger. Tilgjengeliggjøring og gjenbruk av slike data vil derfor, på samme måte som ved ordinær bruk i forskning, utløse spørsmål om ivaretakelse av personvernet. Personopplysningsloven gir generelle regler om behandling av personopplysninger. I tillegg finnes en rekke sektorspesifikke lover og bestemmelser om personvern, slik som helseforskningsloven og helseregisterloven. Mange særlover har dessuten enkelte personvernrelaterte bestemmelser, som taushets- og innsynsbestemmelser. Videre finnes det en rekke veiledere, forskningsetiske retningslinjer med mer som forskere også må kjenne og ta hensyn til.

EUs nye forordning om behandling av personopplysninger (kjent som GDPR), trer i kraft i mai 2018. Formålet med forordningen er blant annet å harmonisere medlemslandenes personvern­regler, modernisere reglene og styrke personvernet. Justis- og beredskapsdepartementet har foreslått å gjennomføre forordningen i norsk rett gjennom en ny personopplysningslov.10 Det tas sikte på at den nye loven skal tre i kraft i mai 2018. Forordningen åpner for nasjonale regler på en del områder, blant annet når det gjelder forskning.

På mange områder innebærer forordningen en videreføring av gjeldende norsk regelverk. På andre områder vil vi få nye regler. For virksomheter som behandler personopplysninger, erstattes den tidligere melde- og konsesjonsplikten med en plikt til å vurdere personvernkonsekvenser, til å gjennomføre eventuelle risikoreduserende tiltak og til å inngå forhåndsdrøftinger med tilsynsmyndighetene. Tilsynsmyndighetene skal legge mer vekt på virkemidler som forhåndskonsultering, etterkontroll (tilsyn og enkeltsaksbehandling) og normarbeid. Dette innebærer at de som behandler personopplysninger, må ta mye større ansvar for at behandling skjer i samsvar med regelverket. Forordningen medfører i tillegg at flere virksomheter må ha personvernombud (personvernrådgiver), og at datasystemer skal bygges etter prinsippene for innebygd personvern.

Rettigheter til data

Mange forskningsinstitusjoner har utarbeidet egne retningslinjer for lagring og for rettigheter til forskningsdata og forskningsresultater. Universiteter og høyskoler har som del av sitt samfunnsansvar å sikre samfunnsnytten av sin forsking. Dette innebærer blant annet formidling, herunder offentliggjøring og utnyttelse. Etter universitets- og høyskoleloven skal de også bidra til innovasjon og verdiskaping basert på forskningsresultater. Dette er overordnede mål for all offentlig finansiert forskning.

Forskningsinstitusjoner må ha retningslinjer internt som regulerer disse forholdene, og sikre at de har tilsvarende avtaler med ansatte og samarbeidspartnere. Mange har dette alt. For eksempel sier Reglement om sikring og forvaltning av arbeidsresultater ved UiT at universitetet som hovedregel har rett til å overta rettigheter til forskningsdata skapt av ansatte i tilknytning til stillingen ved universitetet.11Prinsipper og retningslinjer for forvaltning av forskningsdata ved UiT sier videre at rettigheter til data skal avtalefestes når forskningsdata genereres i prosjekter finansiert av en tredjepart.12 Universitetet i Oslo har Politikk for håndtering av immaterielle rettigheter ved Universitetet i Oslo.13 Her berøres blant annet forholdet mellom forsker, institusjon og akademiske tidsskrifter.

Forskningsinstitusjonene bør gjennomgå sine retningslinjer og arbeidsavtaler for å sikre at de er utformet slik at de tilrettelegger for institusjonenes gjennomføring av denne strategien og for gjennomføring av de nye retningslinjene for åpen tilgang til vitenskapelige artikler.

2.4 Nytt organ for høyere utdannings- og forskningstjenester

I juni 2017 presenterte regjeringen sin plan for omorganisering av kunnskapssektoren og gjorde det i den anledning kjent at oppgaver fra flere ulike virksomheter innenfor høyere utdanning og forskning skal samles i et forvaltningsorgan som skal levere tjenester til høyskoler, universiteter, forskningsinstitutter og helseforetak. CERES blir slått sammen med BIBSYS og enkelte oppgaver fra UNINETT. Disse virksomhetene jobber blant annet med studieadministrative systemer og tjenester, samordning av opptak ved universiteter og høyskoler og andre nasjonale IKT-oppgaver knyttet til høyere utdanning. De jobber også med forskningstjenester for alle de forskningsutførende institusjonene i Norge. Viktige komponenter er forskningsinformasjonssystemet Cristin, arbeid for åpen publisering, kontraktsforhandlinger med tidsskriftseiere og utgivere om tilgang til vitenskapelige artikler og bøker og arbeidet med BIBSYS Infrastructure for Research Data (BIRD, se nærmere omtale under punkt 2.5).

Det nye organet for høyere utdannings- og forskningstjenester blir viktig for oppfølging av regjeringens digitaliseringspolitikk, herunder arbeidet med åpen tilgang til forskningsresultater og forskningsdata. God brukermedvirkning blir avgjørende i dette arbeidet. Det er nødvendig å videreføre og styrke dagens medvirkning knyttet til tjenesteleveransene, og det er behov for god medvirkning på overordnet strategisk nivå. Organets oppgaver skal ivaretas sammen med Norsk senter for forskningsdata (NSD) og UNINETT, som i større grad enn i dag vil bli spisset inn mot leveranse av infrastruktur og støttetjenester.

Kunnskapsdepartementet har fastsatt en Digitalise­rings­strategi for universitets- og høyskolesektoren for 2017–2021, som på en del områder også omfatter infrastruktur og støttetjenester til alle forskningsutførende institusjoner.14 Strategien inneholder målbilder som angir hvilken retning departementet ønsker at utviklingen skal ta, og beskriver tiltak som anses som de viktigste i arbeidet med digitalisering av høyere utdanning og forskning. Strategien stiller tydelige forventninger og krav til etablering av lokale strategier, planer og tiltak for digitalisering og kompetanseutvikling ved den enkelte institusjon. Digitaliseringsstrategien legger også føringer for videre rolle- og arbeidsdeling mellom tjenesteorganet, UNINETT og Norsk senter for forskningsdata (NSD). Denne vil bli endelig avklart i løpet av 2018.

2.5 Investeringer i forskningsdatainfrastrukturer

Det finnes en rekke forskjellige infrastrukturer for forskningsdata i Norge, både fagområdespesifikke og generiske, som betjener flere fagmiljøer. De fagområdespesifikke datainfrastrukturene drives som regel enten med støtte fra en vertsinstitusjon eller gjennom prosjektmidler fra Norges forskningsråd eller Horisont 2020 som dekker investeringer og i noen grad drift i etablerings­fasen.

Nasjonal satsning på forsknings­infrastruktur

Siden 2009 har Forskningsrådet gjennom ordningen Nasjonal satsing på forsknings­infrastruktur inngått kontrakter for omkring fem milliarder kroner til etablering og fornyelse av norsk forskningsinfrastruktur. Av dette har ca én milliard i perioden 2009–2015 gått til etablering og/eller drift av infrastrukturer der hele eller en betydelig del av formålet med infrastrukturen er datahåndtering.15 Dette omfatter både generisk og fagspesifikk e-infrastruktur, vitenskapelige databaser og samlinger, og tjenester for metodeutvikling og dataanalyse. Noen av infrastrukturene er tverrgående og faller innenfor flere fagområder.

Det er fem dataarkiver/infrastrukturer som kan betegnes som generiske, dvs. at de tilbyr tjenester på tvers av de fleste fagområdene. UNINETT Sigma2 AS har etablert National e-Infrastructure for Research Data (NIRD), som tilbyr tjenester og kapasitet til alle fagområder som trenger tilgang til avanserte storskalaressurser for lagring, prosessering og publisering av forskningsdata eller søk i digitale databaser og samlinger.16 Norsk senter for forskningsdata (NSD) er i ferd med å etablere Norwegian Open Research Data Infrastructure (NORDi), en ny løsning for opplasting, bevaring og deling av forskningsdata, som skal støtte åpen tilgang til og gjenbruk av data fra samfunnsvitenskapelig og humanistisk forskning og forskning innenfor medisin, helse, klima og miljø.17Tjenester for sensitive data (TSD) på Universitetet i Oslo (UiO) tilbyr et fullt sett med tjenester fra innsamling av data til analyse, behandling og lagring, i sikrede omgivelser. TSD brukes foruten på UiO også av flere andre nasjonale forskningsinstitusjoner.18UiT Open Research Data er en generisk infrastrukturtjeneste for forskere ved UiT, som i tillegg tilbyr tjenesten DataverseNO også til andre norske forskningsinstitusjoner som ønsker et institusjonelt arkiv for forskningsdata. Tjenesten er også åpen for norske enkeltforskere som har behov for et åpent arkiv for arkivering, publisering og sitering av egne forskningsdata, spesielt for å gi et tilbud som oppfyller krav fra tidsskrifter om at bakgrunnsdata skal være tilgjengelig. Partner­institusjoner får også tilgang til opplæring, støtte til superbrukere og veiledning/manual for kuratering. BIBSYS BIRD er en tjeneste for forvaltning av forskningsdata som er utviklet gjennom et sam­arbeid mellom BIBSYS (nå en del av det nye organet for høyere utdannings- og forskningstjenester) og Handelshøyskolen BI. Infrastrukturen er et tilbud til utdannings- og forskningsinstitusjoner som ønsker å tilby sine forskere et felles verktøy for administrasjon av forskningsdata.

Det er stor variasjon i de fagspesifikke datainfrastrukturene for håndtering, lagring og tilgjengeliggjøring av forskningsdata. Noen er databaser der primærdata fra måleinstrumenter eller fra store undersøkelser lagres og tilgjengeliggjøres. Andre er tjenester der data fra forskningsprosjekter lagres og tilgjengeliggjøres. Noen tilbyr nettsider med innsynsløsninger for data, andre tjenester som tilbyr sikker mellomlagring og analyse av sensitive data, eller søke- og metadatatjenester som forbedrer tilgangen til eksisterende data.

I tillegg til forskningsdatainfrastrukturene over, finnes det også flere offentlig eide datainfrastrukturer/-samlinger som er opprettet for forvaltningsformål, men som i stor grad også benyttes til forskning. Vertsinstitusjonene har jevnt over strukturell finansiering fra staten for å dekke sine formålsbestemte oppgaver, og det varierer hvordan disse dekker kostnadene ved å gi tilgang til data for forskere utenfor etaten selv. Inndekning av disse kostnadene gjøres vanligvis enten gjennom at vertsinstitusjonen finansierer forskerens tilgang til data gjennom egne midler, slik at det oppleves som ­gratis for forskerne, eller at man tar betalt for tilgang gjennom å ta betalt for de verdiøkende tjenestene knyttet til administrasjon og utlevering av data. Folkehelseinstituttet og Statistisk sentralbyrå (SSB) er eksempler på institusjoner som tar betaling for verdiøkende tjenester knyttet til utlevering av data. (Se nærmere omtale av SSB og helsedataproblematikken i kapittel 5). Tjenester som Nasjonalbiblioteket, Arkivverket og Meteorologisk institutt finansierer i stor grad forskernes tilgang til data gjennom egne midler slik at dette er gratis for forskerne. Enkelte av disse har utviklet selvbetjeningsløsninger for forskerne som sikrer forskerne tilgang til data på en kostnadseffektiv måte.

2.6 Status ved forskningsinstitusjonene

Status ved universitetene og høyskolene

Det varierer hvor langt universitetene og høyskolene har kommet i sitt arbeid med policy og planer for håndtering av forskningsdata. Det generelle bildet er at institusjonene erkjenner at området krever både institusjonspolicy og lederoppmerksomhet. Flere institusjoner har pågående prosesser, men har i mindre grad etablert gjennomgående systemer for operativ støtte til enkeltforskere. Ifølge arbeidsgruppen for en IKT-strategi for universitets- og høyskolesektoren savner mange forskere mer tilrettelagte samhandlingsverktøy som er felles for sektoren, og som lett kan involvere deltakere utenfor sektoren, både nasjonalt og internasjonalt.19 Det pekes på at forskere har behov for sikker lagring av data også mens forskningsprosjekter pågår, ikke bare etter at et prosjekt er avsluttet.

Flere av institusjonene har utarbeidet informasjon som viser til nasjonale og internasjonale mål og føringer, og til arkiver eller datainfrastrukturer der forskningsdata kan lagres. Universitetet i Tromsø – Norges arktiske universitet (UiT) har kanskje kommet lengst i arbeidet. I september 2017 ble Prinsipper og retningslinjer for forvaltning av forskningsdata ved UiT lansert og Forskningsdataportalen UiT, en egen operativ tjeneste for lagring av forskningsdata, lokalt åpnet. Av andre eksempler kan nevnes at Universitetet i Oslo nylig har vedtatt Politikk og retningslinjer for forskningsdatahåndtering. Norges teknisk-naturvitenskapelige universitet (NTNU) er i ferd med å lansere en Handlingsplan for åpen tilgang til forskningsdata ved NTNU 2018–2020, og Universitetet i Bergen har etablert en operativ ­tjeneste for sikker adgang til forskningsdata og ­e-­infrastruktur, SAFE, for å håndtere sensitive data.

Universitets- og høgskolerådet (UHR), som er et samarbeidsorgan for akkrediterte institusjoner under universitets- og høyskoleloven, har ikke utarbeidet noen felles politikk for medlemsinstitusjonene knyttet til økt tilgjengeliggjøring av forskningsdata.

Status ved forskningsinstituttene

Instituttsektoren er svært mangfoldig, og det er stor variasjon både med hensyn til hvordan instituttene er organisert, hvordan de er finansiert (statlig basisfinansiering av forskningsinstitutter, direkte grunnfinansiering fra departementer, konkurranseutsatte offentlige og private forskningsmidler nasjonalt og internasjonalt), og hvilke data som frembringes og benyttes. Dette gir også et mangfold av behov og muligheter knyttet til lagring og tilgjengeliggjøring av data. For mange av instituttene kan ikke forskningsdata deles åpent umiddelbart, for eksempel fordi de inneholder identifiserbare personopplysninger, forretningshemmeligheter, eller er fremkommet gjennom samarbeid med private aktører med avtaler om konfidensialitet. Generelt er mange av de teknisk-industrielle instituttene og primærnæringsinstituttene opptatt av at deres forskning ofte gir resultater der forskningsdataene bidrar til verdiskaping og har stort kommersielt potensial.

Andre forskningsinstitutter, som hav- og miljø­institutter som for eksempel forvalter tidsserier, er godt i gang med å få på plass strategier og opplæring for å dele data. Norsk institutt for naturforskning, Norsk institutt for luftforskning, Norsk polarinstitutt og Norsk institutt for bioøkonomi har både retningslinjer og opplæringsstrategier for håndtering av forskningsdata. Artsdata­banken samler ikke selv inn data, men praktiserer full åpen tilgang til de dataene de formidler.

Norsk institutt for luftforskning

Norsk institutt for luftforskning (NILU) har praktisert åpen tilgang til data siden 1973 ved sitt datasenter for internasjonale måleprogrammer. Instituttet har en styrevedtatt IT-strategi med fokus på datasikkerhet, som fastslår prinsippet om åpen tilgang til alle instituttets data. Åpenheten understøtter legitimitet og fremmer bruken av data. Gode eksempler på slik datadeling er EBAS og EVDC.

EBAS er en database for målinger av atmosfærens kjemiske og fysiske egenskaper. Dette inkluderer i hovedsak konsentrasjoner og egenskaper av sporgasser og partikler, og målingene inkluderer parametere knyttet til luftkvalitet og sur nedbør, klimagasser, aerosoler, med mer. EBAS lagrer data på vegne av en rekke nasjonale og internasjonale programmer, alt fra langsiktig overvåking til tidsbegrensede forskningsprosjekter. De aller fleste av dataene stammer fra programmer som oppfordrer til åpen og ubegrenset bruk av data for ikke-kommersiell bruk. For vitenskapelig bruk er disse dataene fritt tilgjengelig og kan gratis lastes ned fra databasens nettside.

EVDC (ESA Atmospheric Validation Data Centre) er den europeiske romorganisasjonens offisielle sentrale database for langtidslagring av såkalte korrelative atmosfæredata. Observasjoner fra fly, ballonger, bakkestasjoner med mer fra hele verden lagres i databasen og brukes deretter av forskere for validering av atmosfæremålinger fra satellitter. Databasen er tilgjengelig online og tilgang til data er gratis, forutsatt at brukerne godtar EVDCs datapolicy. Foruten tilgang til korrelative data tilbyr EVDC verktøy for ekstraksjon, konvertering og lagring av store mengder satellittdata.

De samfunnsvitenskapelige forskningsinstituttene samler inn store mengder data. Der det ikke er krav til sletting ut fra personvernhensyn finnes det gode prosedyrer for deponering av data hos Norsk senter for forskningsdata (NSD). Dette gjøres med store datasett som for eksempel valgforskningsdata.

Forskningsinstituttene følger utviklingen nøye, ikke minst internasjonalt, gjennom sin europeiske organisasjon European Association of Research and Technology Organisations (EARTO).

Forskningsinstituttenes fellesarena (FFA) organiserer de instituttene som inngår i basisfinansieringssystemet for forskningsinstitutter. FFA har i innspill til Kunnskapsdepartementet uttrykt at det bør stimuleres til datadeling, gitt at behovet for å håndtere datamangfold ivaretas på en god måte. FFA peker på at digitaliseringen av økonomien innebærer at mer deling av data vil komme, og noen institutter deltar i utvikling av internasjonale plattformer etablert av store næringsaktører for slik deling. Et eksempel er for eksempel SINTEFs deltakelse i Industrial Data Space.20 Aktørene i slike internasjonale plattformer fremhever at disse vil kunne akselerere dataøkonomien dersom de bidrar til økt tillit, sikkerhet og utviklingen av forretningsmodeller, og samtidig tillater at bedriftene beholder kontrollen over egne data.

Status i helseforetakene

Helseforetakene har i dag ingen felles policy, prinsipper eller retningslinjer for forvaltning av forskningsdata. Det arbeides med retningslinjer for datahåndtering i kliniske studier i regi av NorCRIN, den nasjonale forskningsinfrastrukturen for gjennomføring av kliniske studier.

Fotnoter

1.

Europaparlamentets og rådets direktiv 2013/37/EU av 26. juni 2013 om viderebruk av offentlig informasjon. http://data.europa.eu/eli/dir/2003/98/2013-07-17

2.

https://www.regjeringen.no/no/dokumenter/retningslinjer-ved-tilgjengeliggjoring-av-offentlige-data/id2536870/

3.

www.regjeringa.no/digitaliseringsrundskrivet

4.

«Recommendation of the Council concerning Access to Research Data from Public Funding», Organisasjonen for økonomisk samarbeid og utvikling, 14. desember 2006.

5.

http://ec.europa.eu/research/openscience/index.cfm?pg=home

6.

«Council conclusions on the transition towards an Open Science system», Rådet for Den europeiske union, 27. mai 2016, dokument 9526/16

7.

http://ec.europa.eu/research/openscience/index.cfm?pg=open-science-policy-platform, norsk deltaker: Ernst ­Kristiansen Sintef, http://ec.europa.eu/research/openscience/index.cfm?pg=open-science-cloud

8.

European Strategy Forum on Research Infrastructure (ESFRI): https://ec.europa.eu/research/infrastructures/index_en.cfm?pg=esfri

9.

https://www.regjeringen.no/no/tema/forskning/artikler/open-tilgang-til-vitskapelege-artiklar/id2567744/

10.

Høringsnotat av 6. juli 2017

11.

Reglement om sikring og forvaltning av arbeidsresultater ved UiT gjeldende fra 19.11.2009, sist endret 15.02.2012. Det vises videre til at reglementet gjelder med forbehold for de ufravikelige bestemmelsene i arbeidstakeroppfinnelsesloven (arbeidstakers rett til godtgjøring mv.) og åndsverkloven (respektretten og opphavsmannens rett til å bli navngitt).

12.

Prinsipper og retningslinjer for forvaltning av forskningsdata ved UiT datert 9. mars 2017

13.

Politikk for håndtering av immaterielle rettigheter ved Universitetet i Oslo.

14.

https://www.regjeringen.no/contentassets­/779c0783ffee461b88451b9ab71d5f51/no/­pdfs/­digitaliseringsstrategi-for-universitets--og-hoysk.pdf

15.

Se oversikt i Forskningsrådets rapport «Tilgjengeliggjøring av forskningsdata og data for forskning. Kunnskapsgrunnlag til KDs arbeid med en nasjonal strategi for tilgjengeliggjøring av data», januar 2017, s 10-19.

16.

For Uninett Sigma2 kommer en vesentlig andel av inntektene fra medlemsorganisasjonene (Universitetet i Oslo, Universitetet i Bergen, Norges teknisk-naturvitenskapelige universitet og Universitetet i Tromsø – Norges arktiske universitet).

17.

NSD har grunnfinansiering forvaltet gjennom Norges forskningsråd, inntekter gjennom en medlemskaps-/abonnementsmodell som dekker NSDs rolle som personvernombud for rundt 150 forsknings- og utdanningsinstitusjoner. Utover dette har NSD også inntekter knyttet til håndtering av offentlige databaser og registre.

18.

Oppbygging av TSD er finansiert gjennom prosjekter (Nasjonal satsning på forskningsinfrastruktur og diverse forsknings- og utviklingsprosjekter med støtte fra Forskningsrådet) og finansiering fra Universitetet i Oslo. Driften finansieres gjennom brukerbetaling, oppdrag og støtte fra UiO.

19.

«IKT-strategi for forskning», https://www.uninett.no/sites/default/files/ikt-strategi-uh-forskning-31012017.pdf (delrapport 31. januar 2017 til samlerapporten «IKT-strategi og helhetlige løsninger for norsk universitets- og høgskolesektor», overlevert Kunnskapsdepartementet fra en arbeidsgruppe ledet av Morten Dæhlen. Rapporten utgjorde et viktig grunnlag for regjeringens «Digitaliseringsstrategi for universitets- og høyskolesektoren 2017–2021».

20.

Industrial Data Space er en sammenslutning av virksomheter, med en kjerne av store tyske bedrifter, som har gått sammen for å dele data. http://www.industrialdataspace.org/en/the-association/#mission. Et annet eksempel er proDataMarket, et samarbeid om eiendomsdata finansiert av Horisont 2020, https://blog.prodatamarket.eu/about/.
Til forsiden