2 Et godt grunnlag for kunstig intelligens

Regjeringen vil legge til rette for at Norge skal ha infrastruktur for kunstig intelligens i verdensklasse, i form av digitaliseringsvennlig regelverk, gode språkressurser, raske og robuste kommunikasjonsnett og tilstrekkelig regnekraft. Det skal legges til rette for deling av data innenfor og på tvers av bransjer og sektorer.

Data urns av den østerrikske kunstneren Daniel Huber. Bildet viser tre rikt dekorerte krukker i plast. Gjengitt med tillatelse fra Ars Electronica.

«Data urns», Daniel Huber (AT) – Foto: Ars Electronica

2.1 Data og dataforvaltning

Data er et viktig utgangspunkt for kunstig intelligens. I dag genereres det store mengder informasjon fra en rekke ulike kilder. KI og maskinlæring kan bruke disse dataene til å gi oss viktige innsikter. For å utnytte det potensialet som ligger i kunstig intelligens, er det avgjørende med tilgang til store datasett av god kvalitet. Regjeringen har et mål om å legge til rette for deling av data fra offentlig sektor slik at næringsliv, akademia og sivilsamfunn kan anvende dataene på nye måter.

Data kan betraktes som en fornybar ressurs. Dersom man deler data med andre, har man ikke færre data igjen selv. Samtidig kan verdien av data øke når dataene deles, fordi de kan benyttes i kombinasjon med andre typer data som kan gi ny innsikt, eller av virksomheter med kompetanse som kan bruke dataene på nye og innovative måter.

Åpne offentlige data

All informasjon som lovlig kan publiseres på en offentlig nettside, kan i prinsippet også gjøres tilgjengelig som åpne data. Data som inneholder personopplysninger, som er unntatt offentlighet eller som er underlagt taushetsplikt, skal derimot ikke gjøres tilgjengelig med mindre man har særskilt grunnlag for dette. Eksempler på åpne data fra offentlig sektor er værdata fra Meteorologisk institutt og trafikkinformasjon fra Statens vegvesen.

Personopplysninger

Problemstillinger knyttet til deling og bruk av data er nært koblet til hva slags type data det er snakk om. Et avgjørende skille går mellom bruk av personopplysninger og bruk av data som ikke kan knyttes til enkeltpersoner, for eksempel værdata. Bruk av personopplysninger til utvikling av KI reiser en rekke problemstillinger som må håndteres før man kan dele eller bruke slike data.

Prinsipper for deling av data

Prinsipp for deling av åpne offentlige data

I dag er det ingen lovpålagt plikt til å gjøre offentlige data tilgjengelig for at andre skal kunne bruke dem, men det er et mål at data som kan gjøres åpent tilgjengelig skal deles slik at de kan brukes av andre (det vi kaller «viderebruk»).

«Meld. St. 27 (2015-2016) Digital Agenda for Norge – IKT for en enklere hverdag og økt produktivitet» trakk frem fem sektorer i det offentlige hvor viderebruk av åpne offentlige data anses som særlig samfunnsøkonomisk verdifullt: kultur, forskning og utdanning, statlige utgifter, transport og samferdsel og kart og eiendom (geodata). Det er utviklet egne strategier for deling av data på disse områdene. I tillegg har Direktoratet for økonomistyring (DFØ) laget en egen løsning for publisering av data knyttet til statlige utgifter.

Det er offentlighetsloven som regulerer hvordan offentlige data skal tilgjengeliggjøres for viderebruk. Fra 2012 har digitaliseringsrundskrivet pålagt statlige virksomheter som etablerer nye eller oppgraderer eksisterende fagsystemer eller digitale tjenester, å legge til rette for at data fra disse tjenestene gjøres tilgjengelige i maskinlesbare formater. Virksomheten bør sørge for at data er tilgjengelig i et langtidsperspektiv, med opprettholdt integritet, autentisitet, anvendbarhet og pålitelighet.

De nordiske landene deler mange interesser og verdier når det gjelder KI. Derfor samarbeides det gjennom Nordisk ministerråd på flere områder knyttet til KI. Et av disse områdene er tilgjengeliggjøring av offentlige datasett. En arbeidsgruppe skal identifisere datasett som kan utveksles på tvers av de nordiske landene og skape merverdi for nordiske virksomheter – både offentlige og private – samtidig som etiske aspekter, den tillit og de verdier som er spesielle for Norden, respekteres.

Et viktig tiltak i regjeringens digitaliseringsstrategi for offentlig sektor6 er å etablere et nasjonalt ressurssenter for deling av data i Digitaliseringsdirektoratet. Senteret skal fungere som en kompetansebank, og en av oppgavene blir å bidra til at flere ser verdien av å dele data.

Prinsipper for deling av data mellom virksomheter i offentlig sektor

Det er et mål at innbyggere og næringsliv ikke må levere de samme opplysningene til flere forskjellige offentlige instanser.7 Oppdaterte og kvalitetssikrede opplysninger som deles på tvers av forvaltningsorganer er en forutsetning for «kun én gang»-prinsippet og viktig for å kunne utvikle bedre og mer sammenhengende offentlige tjenester.

I Norge har vi en del informasjon i felles registre, som Folkeregisteret og Enhetsregisteret, men det er også mye informasjon utenfor slike fellesregistre. For å legge til rette for deling av disse dataene mellom offentlige virksomheter, har Brønnøysundregistrene og Digitaliseringsdirektoratet etablert en felles datakatalog som skal gi oversikt over hva slags data de ulike offentlige virksomhetene har, hvordan dataene henger sammen og hva de betyr. Katalogen skal også gi informasjon om hvorvidt dataene kan deles, og vilkår for deling.

Digitaliseringsrundskrivet krever at den enkelte virksomhet synliggjør data som kan deles med andre i Felles datakatalog og på data.norge.no.

Prinsipper for offentlig finansierte forskningsdata

Forskning som skjer ved bruk av offentlige midler, skal være til det beste for alle. Derfor er det viktig at også dataene bak forskningsresultatene er tilgjengelige for flest mulig – for andre forskere, men også for forvaltningen og næringslivet. Bedre tilgang til forskningsdata kan bidra til innovasjon og verdiskaping ved at andre aktører enn forskere kan se nye bruksområder. Det kan også bidra til smartere tjenesteutvikling i offentlig sektor, muligheter for ny næringsvirksomhet og flere arbeidsplasser.

Det er ingen tvil om at langt flere forskningsdatasett enn i dag bør tilgjengeliggjøres, sammen med tilhørende protokoller, metoder, modeller, programvare og kildekode. Slik tilgjengeliggjøring må skje innenfor rammen av et godt personvern, og med nødvendige hensyn til sikkerhet, immaterielle rettigheter og forretningshemmeligheter. Det enorme og økende omfanget av forskningsdata gjør imidlertid at ikke alle data kan arkiveres og vedlikeholdes like lenge. Kostnadene ved å gjøre datasett reelt gjenbrukbare må veies opp mot nytten for forskerfellesskapene og samfunnet.

Regjeringen har lagt frem en egen strategi for tilgjengeliggjøring og deling av forskningsdata.8 Strategien slår fast tre grunnprinsipper for offentlig finansierte forskningsdata i Norge:

  • Forskningsdata skal være så åpne som mulig, og så lukkede som nødvendig.
  • Forskningsdata bør håndteres og tilrettelegges slik at verdiene i dataene kan utnyttes best mulig.
  • Beslutninger om arkivering og tilrettelegging av forskningsdata må tas i forskerfellesskapene.
Prinsipper for deling av data i næringslivet

Den enkelte bedrift eier i utgangspunktet sine egne data, og det er opp til den enkelte hvordan de vil benytte dataene sine, innenfor rammene av personvernlovgivningen. Selv om enkelte bransjer og virksomheter er bevisste verdien av å dele data, er dette unntaket. Mange bedrifter har liten oversikt over egne data, og har derfor heller ikke gjort noe for å klassifisere dataene, eller vurdere om de kan gi økt nytte for egen eller andres virksomhet.9

Rammeverk for deling av data i industrien

I Tyskland ble det i forbindelse med den såkalte «Industrie 4.0»-satsingen etablert et rammeverk, IDS («International Data Space»), for deling av data i industrien. Tilbudet er utvidet til andre lands næringsliv, og i Norge har SINTEF lagt til rette for at norske bedrifter kan benytte seg av rammeverket. Rammeverket er et tilbud om en felles infrastruktur for trygg lagring av næringslivets data. Gjennom rammeverket har bedriftene selv kontroll over sine data, samtidig som de kan dele dem når det er ønskelig.

Kilder: Fraunhofer institut, SINTEF

I Norge har vi enkelte eksempler på frivillig deling av data i næringslivet og mellom næringsaktører og offentlig sektor:

  • Olje- og gassnæringen: I 1995 opprettet Oljedirektoratet og oljeselskapene på norsk kontinentalsokkel databasen Diskos. Diskos er et nasjonalt datalager for lete- og utvinningsrelatert informasjon fra norsk sokkel. Dataene er tilgjengelige direkte på nettet for medlemmene i Diskos-samarbeidet. Ideen bak Diskos er at oljeselskapene skal samarbeide om lagring av letedata og konkurrere på tolkningen av dem.10
  • Geodata: Norge digitalt-samarbeidet er et bredt samarbeid mellom virksomheter som har ansvar for å fremskaffe stedfestet informasjon og/eller som er store brukere av slik informasjon. Partene i samarbeidet er kommuner, fylker, nasjonale etater og private virksomheter som tele- og kraftselskaper.11 Som en del av Norge digitalt-samarbeidet er det blitt opprettet en nasjonal nettside for kartdata og annen stedfestet informasjon i Norge, geonorge.no.

Myndighetene er generelt tilbakeholdne med å kreve at private virksomheter skal dele data. Regjeringens utgangspunkt er at private virksomheter som har felles interesser selv finner sammen for å dele data. Dette kan likevel være vanskelig å få til i praksis.

Regjeringen legger følgende prinsipper til grunn for deling av data fra næringslivet:12

  • Frivillig datadeling er å foretrekke, særlig der aktørene har felles interesser i å dele data.
  • Myndighetene kan legge til rette for deling av data som virksomheten selv ikke ser verdien av å dele, der slik deling gir økt samfunnsnytte.
  • Deling av data kan bli pålagt dersom det er nødvendig, for eksempel begrunnet i samfunnets interesse.
  • Data må deles slik at personer og virksomheter har kontroll over egne data. Personvern, sikkerhet og forretningsinteresser må ivaretas.

En del av den aktiviteten som skjer i næringslivet, skjer på oppdrag fra offentlig sektor, eller etter tillatelser eller konsesjoner fra det offentlige. Offentlige virksomheter har i liten grad utnyttet muligheten til å stille krav om tilgjengeliggjøring eller deling av data i forbindelse med inngåelse av kontrakter eller tildeling av konsesjoner. Regjeringen vil derfor vurdere om det offentlige kan bidra til at flere datasett fra næringslivet blir tilgjengelige gjennom å stille krav om deling av data ved inngåelse av offentlige kontrakter, der det er hensiktsmessig. Regjeringen vil også vurdere å utrede krav om at data gjøres tilgjengelig for det offentlige på konsesjonsområder der slik tilgjengeliggjøring antas å gi spesielt stor nytte for samfunnet.

Metoder for deling av data

Det finnes ulike metoder som kan gjøre det enklere og tryggere å dele data mellom ulike interessenter:

Datasjøer

En datasjø er et sentralt oppbevaringssted for data, for eksempel i en skytjeneste. Dataene kan lagres slik de er, i sitt opprinnelige format, og det kan være en blanding av strukturerte og ustrukturerte data. Det er ikke en forutsetning at dataene struktureres eller merkes. Datasjøen kan deretter brukes for å hente ut data til for eksempel maskinlæring eller andre analyser.

Datastiftelser («Data trusts»)

Dette er en juridisk struktur der en betrodd tredjepart har ansvar for dataene som skal deles. Tredjeparten beslutter hvilke data som skal deles med hvem innenfor det formålet stiftelsen er opprettet for.

Konfidensialitetsbeskyttende grensesnitt

Konfidensialitetsbeskyttende grensesnitt gjør det mulig å gjennomføre ulike analyser på registerdata som inneholder personopplysninger fra flere datakilder uten å kunne se data om enkeltindivider. Prosjektet Remote Access Infrastructure for Register Data (RAIRD) er et samarbeid mellom Norsk senter for forskningsdata (NSD) og Statistisk Sentralbyrå (SSB) om et slikt konfidensialitetsbeskyttende grensesnitt. Informasjonsmodellen for RAIRD er åpent tilgjengelig og kan tas i bruk av alle som ønsker det.13

Syntetiske data

Syntetiske data kan i mange tilfeller være et alternativ til personidentifiserbare data eller anonymiserte data. Dersom man greier å produsere syntetiske datasett med de samme egenskapene som det opprinnelige datasettet, vil man kunne bruke dette til trening av algoritmer eller som testdata. Det betyr at selv datasett som man normalt ville betrakte som sensitive, ville kunne gjøres allment tilgjengelige til bruk i forskning og innovasjon.

Generering av syntetiske testdata til folkeregisteret

Skatteetaten er i ferd med å lage en løsning der maskinlæring brukes til å generere rike syntetiske testdata i et testmiljø for Folkeregisteret. Det syntetiske Folkeregisteret vil tilby syntetiske testpersoner i tillegg til å simulere hendelser. Målet er at virksomheter som bruker informasjon fra registeret kan teste sine integrasjoner uten at reelle personopplysninger inngår i testen. De syntetiske datene vil først bli gjort tilgjengelig for alle som skal teste integrasjon mot Folkeregisteret. På sikt vil de bli tilgjengelig for alle som trenger folkeregisterdata i test.

Kilde: Skatteetaten

Felles åpne programmeringsgrensesnitt (API-er)

Et programmeringsgrensesnitt, eller API, gjør det mulig å gjøre direkte oppslag i en datakilde for å hente ut de ønskede dataene. Dette er en forutsetning for å kunne bruke data i sanntid. Digitaliseringsrundskrivet slår fast at offentlige virksomheter skal gjøre egnet informasjon tilgjengelig i maskinlesbare og helst standardiserte formater, fortrinnsvis gjennom API-er.

Melding til Stortinget om datadrevet økonomi

Regjeringen vil utarbeide en egen melding til Stortinget om deling av data og datadrevet økonomi. Meldingen skal blant annet drøfte viktige temaer som eierskap til data, incentiver for deling av data, og muligheter for rettferdig fordeling av verdier som skapes i en global dataøkonomi. Andre viktige problemstillinger er personvern og sikkerhet ved deling av data og etikk ved bruk av data. Også spørsmål knyttet til kompetanse innenfor data og datadeling, og infrastruktur for datafangst og –deling vil bli behandlet i meldingen. I forbindelse med meldingsarbeidet vil digitaliseringsministeren etablere en ekspertgruppe som skal se på forutsetninger og vilkår for deling av data i og fra næringslivet.

Regjeringen vil

  • legge frem en melding til Stortinget om datadrevet økonomi og innovasjon
  • etablere et ressurssenter for deling av data med spisskompetanse på sammenhengen mellom jus, teknologi, forretnings- og forvaltningsprosesser
  • etablere et sett prinsipper for uthenting og håndtering av data fra sentrale registre, og en felles API-katalog som skal gi bedre utnyttelse av grunndata gjennom å gi en oversikt over grensesnitt til dataene (API)
  • vurdere virkemidler som kan gjøre det enklere for bransjer å dele data, og som samtidig tar hensyn til personvern, sikkerhet og forretningsinteresser
  • gi veiledning til offentlige virksomheter om hvordan de kan sikre tilgang til data ved inngåelse av kontrakter, f.eks. ved standard avtaleformuleringer
  • vurdere på hvilke områder det kan være i samfunnets interesse å kreve at data fra næringslivet gjøres tilgjengelig, og utrede om krav til tilgjengeliggjøring av data i forbindelse med tildeling av konsesjoner kan være et egnet virkemiddel for dette

2.2 Språkdata og språkressurser

Språkteknologi, for eksempel i form av talegjenkjenning og språkforståelse, er en viktig komponent i KI. Behandling av naturlig språk («Natural Language Processing», NLP) handler om å registrere naturlig språk (tekst/lyd) og forstå meningen og sammenhengen. Generering av naturlig språk («Natural Language Generation», NLG) handler om å produsere tekst basert på data. Disse teknikkene er viktige i utviklingen av virtuelle assistenter og i analyser der utgangspunktet er ustrukturerte data.

Analyse og klassifisering av ustrukturerte data i Utenriksdepartementet

Utenriksdepartementet (UD) mottar årlig 5-6000 rapporter fra utenriksstasjoner, delegasjoner o.l. Tidligere har det vært svært vanskelig å finne frem i all denne informasjonen.

Etter at UD i 2018 tok i bruk maskinlæring med behandling av naturlig språk for å analysere og klassifisere innholdet i disse dokumentene, er det blitt mulig å finne frem til nesten all relevant informasjon om et emne. Løsningen brukes også til å hente ut den viktigste informasjonen i rapporter og lage oppsummeringer.

I arbeidet med løsningen har UD samarbeidet med Universitetet i Oslo, som har bidratt med løsninger for kategorisering av norsk språk. Planen er å utvide løsningen med informasjon fra arkiv og eksterne forskningsrapporter etter hvert.

Kilde: Utenriksdepartementet

For at slike løsninger skal være tilgjengelige på norske og samiske skriftspråk og dialekter, må teknologien tilpasses disse språkene og de lokale forholdene. Til dette kreves det språkressurser.

Språkbanken i Nasjonalbiblioteket stiller språkdata til disposisjon for utvikling av språkteknologi på norsk. Nasjonalbiblioteket og Språkrådet skal gjennom koordinert innsats arbeide for at ressursene i språkbanken videreutvikles. De har også et ansvar for at både det offentlige som bestiller og utviklermiljøer både i offentlig og privat sektor får kjennskap til og etterspør språkressursene.

De samiske språkene er spesielt sårbare. Språkteknologi og språkteknologiske ressurser på samisk er viktig for å bidra til fremtidig utvikling og bruk av språket, samt på sikt å kunne utvikle tjenester basert på kunstig intelligens også for samisk. Divvun og Giellatekno - Senter for samisk språkteknologi ved Universitetet i Tromsø, jobber begge med å utvikle ulike språkteknologiske verktøy for samisk. Regjeringen vil komme tilbake til spørsmålet om samiske språkdata og språkressurser i en melding til Stortinget om samisk språk, kultur og samfunnsliv. Hovedtema for meldingen vil være digitalisering.

En av utfordringene i arbeidet med å legge til rette for språkteknologi på norsk og samisk, er å sikre en tilstrekkelig mengde språkdata innenfor ulike domener – som medisin, IKT, transport osv. Det er behov for både skriftlige data og muntlige data, som dekker dialekter og uttalevariasjon. Nyttige grunnlagsressurser er for eksempel flerspråklige terminologilister, områdespesifikke tekster og taleopptak eller parallelle tekster på bokmål, nynorsk og ulike samiske språk. De språklige strukturene i tekst produsert av det offentlige utgjør verdifulle data for språkteknologisk forskning og utvikling. Det er viktig å legge til rette for gjenbruk til dette formålet.

Det er grunn til å tro at det offentlige har langt mer data som kan brukes til utvikling av språkteknologi enn sektoren selv er klar over. Regjeringen vil derfor bidra til å øke bevisstheten om språkdata og språkressurser i det offentlige, blant annet gjennom å omtale slike data spesielt i digitaliseringsrundskrivet.

Kommunal- og moderniseringsdepartementet har forsterket informasjonsforvaltningsmiljøet i Digitaliseringsdirektoratet med ressurser som skal muliggjøre et nærmere samarbeid med Nasjonalbiblioteket og Språkrådet om strategier for å sikre at offentlige språkressurser kan brukes til språkteknologiske formål. Dette kan bl.a. omfatte veiledning i hva som kan anses som språkressurser og arbeid for å sikre avlevering av slike språkressurser til Språkbanken.

Språkteknologiske hjelpemidler

Tuva er et hjelpemiddel for å diktere tekst (talegjenkjenning) og navigere på PC med stemmen (talestyring). Produktet ble utviklet av Max Manus i 2017 og tilbys personer med varige funksjonsnedsettelser. Løsningen bruker KI og bygger på ressurser fra Språkbanken. Datasettet utviklet for denne løsningen nå fritt tilgjengelig i Språkbanken for andre utviklere.

eTranslation er en maskinoversettelsestjeneste utviklet av EU, som kan benyttes av offentlig ansatte i EØS-området. Funksjonaliteten for norsk språk i løsningen bygger på EØS-oversettelser fra UD, med bidrag fra Semantix' oppdrag for offentlige virksomheter og Standard Norges oversettelser av standarder. Datasettene tilbys i Språkbanken til fri benyttelse for utviklere og forskere.

Kilde: Kulturdepartementet

Regjeringen vil

  • gi en anbefaling i digitaliseringsrundskrivet om offentlig produsert tekst, som en type data som gjøres tilgjengelig for gjenbruk til språkteknologiske formål, og avleveres til Språkbanken og Felles begrepskatalog
  • utforme standardformuleringer til bruk i offentlige kontrakter for å gi offentlig sektor rettigheter til språkressursene som kommer ut av oversettelsestjenester og andre språktjenester
  • legge frem en melding til Stortinget om språk
  • fortsette samarbeidet med Universitetet i Oslo om klart og digitaliseringsvennlig lovspråk
  • legge frem en melding til Stortinget om samisk språk, kultur og samfunn, med fokus på digitalisering

2.3 Regelverk

Norge har lang tradisjon for å modernisere regelverk for å møte den teknologiske utviklingen, helt tilbake til eRegelprosjektet14 i 2000. Det er et mål at lover og regler skal være mest mulig teknologinøytrale slik at de kan anvendes selv om ny teknologi og digitalisering endrer samfunnet vårt og måten vi lever på.

Samtidig ser vi ofte at det blir fremsatt ønsker om regulering når nye teknologier fører til problematiske anvendelser. Med kunstig intelligens har vi sett eksempler på dette, blant annet knyttet til valgmanipulasjon i sosiale medier og såkalte «deep fakes». Samtidig er det krevende – og ofte uhensiktsmessig – å regulere en teknologi som fortsatt er i en tidlig fase. For tidlig regulering kan forme utviklingen på en utilsiktet måte, skape skjevheter i markedet og begrense potensialet for innovasjon. I tillegg vil en gitt teknologi oftest både ha positive og negative anvendelser. Den samme underliggende teknologien som gjør det mulig å lage «deep fakes» gjør det for eksempel også mulig å lage syntetiske testdata – en teknologi som bidrar til å beskytte personopplysninger.

Digitaliseringsvennlig regelverk

Regjeringen er opptatt av at regelverket skal gjenspeile mulighetene og utfordringene som følger med ny teknologi, også kunstig intelligens. I tillegg er det et mål at vi har et digitaliseringsvennlig regelverk. Regelverket bør legger til rette for hel- og delvis automatisert saksbehandling, og ikke inneholde unødvendige skjønnsbestemmelser.15 Regelverk som egner seg for automatisert saksbehandling bør være formulert slik at det kan leses av en maskin og anvendes i løsninger som benytter kunstig intelligens.

Det er behov for å vurdere om det er områder der regelverket legger uhensiktsmessige og uønskede begrensninger for utvikling og bruk av kunstig intelligens. Det er blant annet aktuelt å se på særlovene for enkelte offentlige virksomheter for å se hvordan regelverket bedre kan legge til rette for deling og bruk av data, og utvikling og bruk av kunstig intelligens.

En slik prosess vil kreve at man går grundig inn i de enkelte sektorregelverkene, og at man trekker tverrfaglig kompetanse inn i arbeidet, slik at man tar hensyn både til samfunnets behov, individets krav på personvern og de teknologiske mulighetene. Arbeidet må sees i sammenheng med gjennomgangen av regelverk for å fjerne hindringer for digitalisering og innovasjon, omtalt i regjeringens strategi for digitalisering i offentlig sektor.

Områder som skaper særlige utfordringer:

Interoperabilitet

Det kan være en utfordring at ulike sektorregelverk bruker samme begrep på ulike måter. Inntekt betyr for eksempel ikke det samme i Skatteetaten som i NAV, og begrepet samboer er definert på en rekke måter i ulike regelverk. Det er et mål for regjeringen å oppnå semantisk interoperabilitet i regelverket, slik at det lettere kan leses av en maskin og anvendes til kunstig intelligens. Dersom begrepene ikke betyr det samme, er det viktig å ha informasjon om dette slik at løsningen ikke gir misvisende resultater.

Personopplysninger – samtykke og lovhjemmel

Data som inneholder personopplysninger er omfattet av personopplysningsloven. Prinsippet om formålsbegrensning innebærer at formålet for behandlingen av personopplysninger må være tydelig angitt og fastsatt når opplysningene samles inn. Dette er helt grunnleggende for at den enkelte skal kunne ha kontroll over opplysningene sine og ta et informert valg om samtykke til databehandlingen. Utvikling og bruk av kunstig intelligens krever ofte mange forskjellige typer personopplysninger – opplysninger som i noen tilfeller egentlig er samlet inn for andre formål. I tillegg vil håndtering av data, for eksempel helsedata, kunne være omfattet av annet regelverk, som helseregisterloven.

Den mest utbredte måten å skaffe seg lovlig tilgang til personopplysninger for bruk i KI er samtykke. Samtykke innhentes ofte gjennom at brukeren godkjenner en sluttbrukeravtale og gir samtykke til behandling av data i forbindelse med at han eller hun ønsker å ta i bruk en tjeneste. Avtalen skal blant annet opplyse om hvordan virksomheten vil bruke opplysningene som innhentes og hvem de kan dele opplysningene med. Det skal også være mulig å trekke tilbake et slikt samtykke, og enkelte tjenester åpner for at man selv kan administrere bruken av personopplysninger mer detaljert.

Offentlig sektor innhenter og behandler ofte personopplysninger uten at brukeren har gitt eksplisitt samtykke. I slike tilfeller skjer innsamlingen med utgangspunkt i en lovhjemmel som gir rettslig grunnlag til å samle inn og bruke data om innbyggerne for bestemte formål. I Norge finnes det i dag ikke noen samlet løsning der innbyggerne selv kan se hvilke opplysninger som er samlet inn av det offentlige og administrere disse, men det er etablert løsninger på viktige enkeltområder, som helsenorge.no. Her kan brukeren for eksempel administrere hvilke helsepersonell som skal ha tilgang til kjernejournal og journaldokumenter, reservere seg mot registrering i utvalgte helseregistre og gi fullmakter til pårørende.

Datasett basert på samtykke vil i de fleste tilfeller være ukomplette eller inneholde utvalgsskjevheter som kan påvirke resultatene av analyser som gjøres på dataene. Dette er en viktig grunn til at vi har sentrale registre der registrering er lovfestet og obligatorisk.

Når personopplysninger er innsamlet med utgangspunkt i en lovhjemmel, blir muligheten for å bruke opplysningene til noe annet enn det opprinnelige formålet begrenset, hvis ikke den nye bruken også er forankret i en lovhjemmel. Dette gjør at offentlige virksomheter i liten grad har mulighet til å bruke dataene de har samlet inn for å gjøre analyser av egen virksomhet ved hjelp av KI, utover den gitte hjemmelen for det aktuelle datasettet. Regjeringen ønsker at offentlige virksomheter i større grad skal kunne bruke sine data til å utvikle og ta i bruk KI.

Regulatoriske utfordringer på helseområdet

På enkelte områder innenfor helse kan det være behov for å utvikle regelverk før man prøver ut metoder basert på KI. På andre områder er dette ivaretatt av eksisterende regelverk: Algoritmer som er en del av programvaren i medisinsk utstyr, slik som kirurgiske roboter eller programvare som renser eller bearbeider bilder i billeddiagnostiske instrumenter, faller for eksempel inn under reguleringen av medisinsk utstyr. Statens legemiddelverk gir veiledning og fører tilsyn med regelverket for slikt utstyr på det norske markedet.

Utvikling og bruk av verktøy basert på KI er avhengig av informasjon fra flere enn den enkelte pasienten som mottar helsehjelp i det enkelte tilfellet. I dag er bruk av data til primære forhold (pasientbehandling) og bruk av pasientdata til forskning (sekundærbruk) regulert på ulik måte. Dagens regelverk har i liten grad klare hjemler for å kunne bruke helseopplysninger om én pasient for å gi helsehjelp til neste pasient, med mindre man har samtykke fra pasienten. Samtidig kan det gis dispensasjon fra taushetsplikten for å bruke pasientdata til forskning. KI utfordrer skillet mellom forskning og pasientbehandling, fordi det ofte vil være behov for å «ta med» pasientopplysningene fra forskningen når verktøy basert på KI utviklet i et forskningsprosjekt skal tas i bruk i pasientbehandling. Dispensasjonen fra taushetsplikten vil da ikke lenger gjelde, og bruken av personopplysningene er ikke lenger lovlig.

Helse- og omsorgsdepartementet sendte i juli 2019 på høring et forslag om tilgjengeliggjøring av helseopplysninger og andre helsedata i helseregistre.16 Forslaget gjelder tilgjengeliggjøring av helsedata til bruk i statistikk, helseanalyser, forskning, kvalitetsforbedring, planlegging, styring og beredskap for å fremme helse, forebygge sykdom og skade og gi bedre helse- og omsorgstjenester.

Helse- og omsorgsdepartementet vurderer også om det bør gjøres endringer i regelverk som gjelder tilgang til helseopplysninger til bruk i læringsarbeid og kvalitetssikring. Arbeidet inkluderer å se på adgangen til å bruke helseopplysninger i beslutningsstøtteverktøy. I tillegg har Helsedirektoratet, Direktoratet for e-helse og Legemiddelverket, i samråd med de regionale helseforetakene, fått i oppdrag å kartlegge hvilke muligheter og utfordringer bruk av kunstig intelligens medfører, og hvilke tilpasninger i rammevilkår på nasjonalt nivå som kan være nødvendig.

På lengre sikt vil flere oppgaver som i dag utføres av helsepersonell kunne gjennomføres av autonome systemer og kunstig intelligens. Eksempler på dette spenner fra automatisk generering av pasientjournal, pasientlogistikk og flåtestyring av ambulansetjenesten til autonome kirurgiroboter. Selv om det blir et større innslag av automatisering og autonome verktøy innenfor helse, er det fortsatt helsepersonellets ansvar at helsehjelpen som ytes er forsvarlig.

Helseanalyseplattformen

Regjeringen vil etablere en nasjonal løsning for å tilgjengeliggjøre helsedata til forskning og annen sekundærbruk, Helseanalyseplattformen. Plattformen vil gi mulighet for mer avanserte analyser av norske helsedata og legge grunnlaget for nye typer medisinsk og helsefaglig forskning. Helsedata vil blant annet kunne utnyttes mer aktivt i utviklingen av legemidler og medisinsk teknologi.

Kilde: Direktoratet for e-helse

Regulatoriske sandkasser

Regulatoriske sandkasser er først og fremst et virkemiddel for å fremme ansvarlig innovasjon. En regulatorisk sandkasse skal gi virksomheter mulighet til å prøve ut nye teknologier og/eller forretningsmodeller innenfor gitte rammer. I denne strategien brukes begrepet både om:

  • lovendringer som åpner for forsøk, for eksempel etter søknad, gjerne innenfor et begrenset geografisk område eller et begrenset tidsrom
  • mer omfattende tiltak på områder der det er behov for tett oppfølging og veiledning, som oftest fra tilsynsmyndigheten på området

Konseptet regulatoriske sandkasser er mest kjent fra finanssektoren, hvor tilsynsmyndigheter i flere land har gitt utvalgte virksomheter mulighet til å teste ut bestemte produkter, teknologier eller tjenester på et begrenset antall kunder, i en begrenset tidsperiode under tett oppfølging. Finanstilsynet åpnet i desember 2019 en regulatorisk sandkasse for finansiell teknologi («fintech»). Formålet med den regulatoriske sandkassen er å øke Finanstilsynets forståelse av nye teknologiske løsninger i finansmarkedet, samtidig som innovative virksomheter får bedre forståelse for krav i regelverket og hvordan disse virker på nye forretningsmodeller, produkter og tjenester.

Det gir imidlertid ikke mening å snakke om én regulatorisk sandkasse for kunstig intelligens. KI-løsninger er ikke en ensartet gruppe tjenester, og de møter et bredt spekter av regulering og regulatoriske myndigheter avhengig av formål og funksjonalitet.

Regjeringen har allerede etablert regulatoriske sandkasser på transportområdet, i form av lovendringer som åpner for forsøksvirksomhet.

  • For autonome kjøretøy er det innført en lov som gjør det mulig å få tillatelse til å gjennomføre prøveprosjekter med kjøretøy uten fører. Loven trådte i kraft 01.01.2018.17
  • Norske sjøfartsmyndigheter etablerte det første testområdet for autonome fartøy allerede i 2016. I etterkant er ytterligere to slike testområder godkjent.18 I 2019 vedtok Stortinget ny havne- og farvannslov19 som åpner for at man etter søknad kan få tillatelse til autonom kystseilas. Slik tillatelse gir rett til å seile i angitte lospliktige farleder eller områder uten los.

Når det gjelder forsøk med avvik fra gjeldende lover og forskrifter om hvordan staten, fylkeskommunene eller kommunene skal organisere sin virksomhet og løse sine oppgaver, kan dette gjøres med hjemmel i særlover, som i de nevnte eksemplene, eller i forsøksloven. Offentlig forvaltning kan med hjemmel i forsøksloven søke Kommunal- og moderniseringsdepartementet om avvik fra lover og forskrifter for å prøve ut nye måter å organisere sin virksomhet eller løse sine oppgaver på, for en periode på inntil fire år. I melding til Stortinget om innovasjon i offentlig sektor vil vi vurdere om forsøksloven gir tilstrekkelig handlingsrom for å teste nye løsninger basert på kunstig intelligens.

Satsing på autonome skip

Norsk skipsfartsnæring ligger langt fremme når det gjelder å utvikle og utnytte ny teknologi. Norge vil få det første større autonome skipet i kommersiell drift - Yara Birkeland. Kongsberg-gruppen utruster verdens første helelektriske, utslippsfrie, autonome containerskip på oppdrag fra Yara. Skipet skal transportere kunstgjødsel fra Yaras fabrikk på Herøya til havnene i Brevik og Larvik. Fartøyet skal leveres i 2020, og vil etter planen gradvis gå fra tilpasset bemannet drift til full autonom drift med fjernovervåkning i 2022. Skipet vil erstatte mye veitransport (anslagsvis 40 000 lastebiltransporter årlig), og vil gi mindre klimagassutslipp, bedre lokal luftkvalitet og mindre støy.

I tillegg har Norgesgruppen (ASKO) fått midler fra ENOVA (119 millioner NOK) til å etablere en autonom transportkjede over Oslofjorden, mellom Moss og Holmestrand. To sjødroner vil da erstatte 150 daglige (ca. 50 000 årlige) trailerturer mellom Østfold og Vestfold. Det er anslått at disse fullelektriske og autonome transportfergene skal være i drift i løpet av 2024.

Kilder: Sjøfartsdirektoratet/Yara og Enova

Regjeringen vil etablere en regulatorisk sandkasse for personvern under Datatilsynets myndighetsområde. Et slikt tiltak oppfyller flere formål:

  • Virksomhetene kan få økt forståelse av de regulatoriske kravene som stilles på personvernområdet, og korte ned tiden fra utvikling og testing til faktisk utrulling av KI-løsninger i markedet. Løsninger som settes i drift etter å ha vært utviklet i sandkassen vil kunne fungere som foregangseksempler, og være til hjelp for andre virksomheter som ønsker å utvikle tilsvarende løsninger.
  • Myndighetene kan få økt forståelse av nye teknologiske løsninger og lettere identifisere potensielle risikoer og problemstillinger på et tidlig stadium, slik at man eventuelt kan utarbeide veiledningsmateriale og avklare hvordan regelverket skal brukes.
  • Myndighetene og bransjene kan identifisere sektorer hvor det er behov for egne bransjenormer.
  • Enkeltindividet og samfunnet som helhet vil tjene på at utvikling av nye og innovative løsninger foregår innenfor ansvarlige rammer.

Regjeringen er positiv til å utvikle flere regulatoriske sandkasser på ulike områder. Ansvaret for slike regulatoriske sandkasser bør plasseres i det miljøet som har best forutsetninger for å teste ut nye løsninger. På noen områder, slik som videreutvikling av smarte byer og autonome transportløsninger, kan det være naturlig at dette ansvaret ligger hos lokale og regionale myndigheter eller andre fagmiljøer.

Regulatorisk sandkasse hos Information Commissioner's Office (ICO)

Det britiske datatilsynet, ICO, prøver ut en regulatorisk sandkasse som skal støtte utvikling av produkter og tjenester som er innovative og har stor allmennytte. Virksomheter kan få gjennomgått og vurdert hvordan de bruker personopplysninger i løsningene sine. ICO vil i test- og utviklingsfasen av løsningene kunne gi dispensasjon fra håndhevingstiltak. ICO ønsker å jobbe med produkter og tjenester som er i forkant av utviklingen, og som opererer i områder der det er reell usikkerhet med hensyn til hvordan regelverket skal fortolkes.

Etter en åpen søknadsrunde har ICO plukket ut 10 virksomheter av forskjellig type og størrelse, og fra ulike sektorer, som tilbys gratis og profesjonell veiledning fra ICO-ansatte. Et av prosjektene er Heathrow flyplass' prosjekt for å vurdere om ansiktsgjenkjenning kan brukes til innsjekk, i sikkerhetskontrollen, bagasjedropp mm. for å skape en sømløs opplevelse på flyplassen. Et annet prosjekt er hos selskapet TrustElevate, som ved bruk av KI skal utvikle en modell for aldersverifikasjon av barn og unge under 16 år i forbindelse med tilgang til sosiale medier.

Kilde: Datatilsynet

Forvaltningsloven og arkivloven

Både Arkivlovutvalgets20 og Forvaltningslovutvalgets21 utredninger vil påvirke offentlig saksbehandling og bruk av kunstig intelligens i offentlig forvaltning.

Saksbehandlingen i offentlig sektor er i stor grad regelstyrt, med større eller mindre elementer av skjønnsmessige vurderinger i prosessen. Det betyr at en løsning ikke behøver å være enten manuell eller automatisert. Man kan ha løsninger der kun enkelte unntakstilfeller behandles manuelt, eller prosesser der en saksbehandler må inn på gitte punkter for å gjøre en vurdering, men der resten av prosessen er automatisk og regelstyrt. Allerede i dag er det mye saksbehandling i offentlig sektor som er automatisk. Det finnes saksbehandlingssystemer med integrert søknadsdialog som gir muligheter for å fatte automatiserte vedtak umiddelbart.

Felles for dagens automatiserte sakbehandlingsløsninger er at de er regelbaserte. Regelverket er programmert inn i løsningen, og dermed er det mulig å begrunne vedtak. Forvaltningsloven krever at alle enkeltvedtak begrunnes. Denne plikten til å gi en begrunnelse er viktig for å ivareta innbyggernes mulighet til å etterprøve og kontrollere beslutninger som fattes om dem.

Det er et stort potensial for økt bruk av kunstig intelligens i offentlig saksbehandling – både i form av regelstyrte systemer og maskinlæring. Forvaltningslovutvalget peker på at automatisering kan bidra til mer likebehandling og konsistent gjennomføring av regelverket. Samtidig må det være en forutsetning ved innføring av saksbehandlingsløsninger med elementer av KI at algoritmenes vurderinger er minst like gode og tillitvekkende som det menneskelige skjønnet de erstatter. For å kunne være sikre på at det er slik, må vi ha systemer som er transparente og forklarbare.

NOU 2019: 5 Ny forvaltningslov

Forvaltningslovutvalget ble oppnevnt i 2015 og avla sin rapport våren 2019. Sentralt i utvalgets mandat var å «utarbeide en lov som legger forholdene til rette for og bygger på at en stor del av saksbehandlingen i forvaltningen skjer eller vil skje digitalt.»

Utvalget påpeker at automatisering av beslutningsprosesser kan gi store effektivitetsgevinster, særlig når saksmengden er stor. Automatisering kan også bidra til økt likebehandling, siden alle som etter systemets kriterier er i samme situasjon, automatisk behandles likt. Automatisering gir konsistent gjennomføring av regelverk og kan blant annet forhindre ulik praksis. Automatisert saksbehandling kan også gi økt implementering av rettigheter og plikter, for eksempel ved å automatisk treffe vedtak som innvilger ytelser når vilkårene er oppfylt. Dette kan særlig være til fordel for ressurssvake i samfunnet. Mer konsekvent implementering av plikter kan lede til høyere regeletterlevelse og en oppfatning blant borgerne om at folk flest bidrar med sin andel, som igjen kan bidra til å bygge tillit.

Der man har behov for skjønnsutøvelse, kan regelbaserte systemer skille ut aktuelle saker eller sjekkpunkter til manuell vurdering. Utvalget peker på at maskinlæring kan gi nye muligheter for automatisering av vurderingspregede kriterier.

Utvalgets flertall foreslår en hjemmel til å fastsette forskrift om at forvaltningsorganer på bestemte saksområder kan treffe avgjørelser ved helautomatisert saksbehandling. Avgjørelser som er lite inngripende overfor den enkelte, kan treffes uten at det gis forskrift om det. I tillegg foreslår utvalget at forvaltningsorganet skal dokumentere det rettslige innholdet i automatiserte beslutningssystemer. Slik informasjon skal gjøres offentlig tilgjengelig, hvis ikke annet følger av lov eller forskrift eller særlige hensyn taler mot det.

Forvaltningslovutvalget ser at det kan være vanskelig å gjennomføre sammenhengende tjenester uten å dele data på tvers av virksomheter. Manglende adgang til å dele opplysninger kan gjøre det vanskeligere å organisere forvaltningsapparatet på en hensiktsmessig måte, og hindre helautomatisering av saksbehandlingen på områder som ligger til rette for det. Utvalget foreslår derfor at det skal være adgang til å dele taushetsbelagte opplysninger med andre forvaltningsorganer som har «saklig behov». Dette er en utvidelse i forhold til gjeldende lov.

Kilde: NOU 2019: 5 Ny forvaltningslov – Lov om saksbehandlingen i offentlig forvaltning (forvaltningsloven)

Arkivlovutvalget er i sin rapport opptatt av at det må arbeides med å sikre at KI-drevne prosesser og beslutninger dokumenteres, og at dokumentasjonen sikres på en slik måte at den er autentisk og anvendelig. Eksisterende arkiveringsrutiner, arkivsystemer og arkivinstitusjoner i det offentlige er foreløpig ikke rustet til å håndtere denne utfordringen. Utvalget anbefaler at det må ses på hvordan funksjonalitet for arkivering kan bygges inn i saksbehandlingsprosessene, også for å fange opp de spesielle aspektene som følger av bruk av kunstig intelligens.

Kunstig intelligens kan også brukes til å oppnå bedre og mer effektiv klassifisering og sortering av informasjon, og slik forenkle og forbedre journalføring og arkivering i fremtiden.

Regjeringen vil

  • gjennomgå og vurdere regelverk som er til hinder for hensiktsmessig og ønsket bruk av kunstig intelligens i offentlig og privat sektor
  • stille krav om gjennomsiktighet og etterrettelighet i nye løsninger for offentlig forvaltning der KI er en del av løsningen
  • etablere et veiledningsmiljø og regulatorisk sandkasse på personvernområdet
  • være positiv til å etablere flere regulatoriske sandkasser etter initiativ fra offentlige og private virksomheter
  • etablere en helseanalyseplattform for å effektivisere og forenkle tilgangen til helsedata til forskning og analyse, samtidig som personvernet styrkes
  • gjøre det mulig å benytte helsedata mer aktivt i testing av effekt og sikkerhet i legemidler og medisinsk teknologi

2.4 Infrastruktur – nettverk og regnekraft

Utbygging av ekomnettene

Elektroniske kommunikasjonsnett (ekomnett), og i særdeleshet mobilnettene, utgjør en grunnmur for digitaliseringen i samfunnet. Norge har godt utbygde fjerdegenerasjons mobilnett (4G) med meget god dekning. I det norske mobilmarkedet er det planer om å bygge landsdekkende 5G-nett innen 2023.22 Dette vil være viktig for å realisere mulighetene som ligger i 5G-teknologi og 5G-nett, ikke minst som underliggende teknologi for tingenes internett (IoT).

Tingenes internett er en betegnelse som gjerne brukes på den stadig økende mengden sensorer som er koblet til internett. Dette kan være alt fra mobiltelefoner og private smarthusløsninger, til sensorer i renovasjonsutstyr, for måling av trafikk, luft- og vannkvalitet, støy mm. Dataene kan blant annet brukes i prediktivt vedlikehold, beslutningsprosesser og utvikling av nye forretningsmodeller. Det er IoT-løsninger også i dagens 4G-nett, men fordi 5G både er raskere enn 4G, kan håndtere mye større datamengder, og registrere svakere signaler, vil 5G spille en betydelig rolle i utviklingen av tingenes internett. Den økte kapasiteten er spesielt viktig i tett befolkede områder.

5G-infrastruktur blir derfor viktig for å gjennomføre en fullskala realisering av tingenes internett med en kapasitet som dagens teknologi ikke kan levere. Dette vil åpne for helt nye anvendelser i ulike samfunnssektorer, som f.eks. transport, helse og omsorg og smarte byer.

Mobilnettene vil være en viktig muliggjørende teknologi for KI, ikke bare i sin rolle som kommunikasjonsinfrastruktur, men også gjennom den enorme mengden kommunikasjonsdata som genereres i produksjonen av tjenestene. Anonymiserte metadata fra mobilnettene kan nyttiggjøres som innsatsfaktor i systemer som bruker KI for dataanalyse, forbedring av beslutningsgrunnlag og styring av prosesser. Slike data er allerede kommersielt tilgjengelige fra mobiloperatørene (Telenor, Telia og Ice). Bruk av slike data er regulert i en rekke regelverk, både sektorlover og personopplysningsloven. Regjeringen vil følge utviklingen på området og vurdere hvordan man kan legge til rette for økt bruk av slike data.

I transportsektoren vil utbygging av ekomnettene, utbredelsen av tingenes internett og tilgang til anonymiserte metadata fra kommunikasjon være viktige elementer for å realisere de mulighetene som ligger i bruk av kunstig intelligens, slik som:

  • selvkjørende og autonome biler, busser og lastebiler, droner, tog og skip
  • intelligent trafikkstyring, kontroll og påvirkning av adferd i trafikken
  • tidlig varsling om behov for utskiftinger og vedlikehold av infrastrukturen
  • prediksjon av reisevaner
  • mer avansert ruteoptimalisering

Transport- og kommunikasjonsinfrastruktur er også sentralt i utviklingen av smarte byer og kommuner. Smartbyløsninger som tilpassede helsetjenester, smart energi-forsyning, og styring av bygg med løsninger som utnytter stordata og kunstig intelligens, vil være avhengig av raske og robuste ekomnett.

Regjeringen ønsker økt takt i den videre bredbåndsutbyggingen. Forslaget til bredbåndsutbyggingslov inneholder blant annet tiltak som legger til rette for felles utnyttelse av eksisterende fysisk infrastrukturer, tiltak for at utbyggere av mobil- og bredbåndsnett skal få informasjon om, og kunne ta del i, pågående og planlagte bygge- og anleggsprosjekter, og tiltak som skal sikre utbyggerne informasjon om eksisterende fysisk infrastruktur. I tillegg vil loven sikre at nye bygninger, og bygninger som gjennomgår renovering, klargjøres for høyhastighetsnett.

Regjeringen vil legge frem en egen melding til Stortinget om elektronisk kommunikasjon.

Regnekraft (High Performance Computing, HPC)

På mange forsknings- og forvaltningsområder er det en sterk vekst i mengden data. Innenfor forskning er beregninger og datadrevet forskning blitt viktige arbeidsmåter, ved siden av eksperimenter og teoriutvikling. Dette gir et økende behov både for lagring og tilgjengeliggjøring av data, men også for regnekraft til å behandle dataene. Vitenskapelige beregninger gjør det mulig å analysere og identifisere nye teoretiske sammenhenger fra de store datamengdene som genereres fra for eksempel gensekvensering, satellittobservasjoner eller forskningsskip.

Mange av forskningsprosjektene som behandler store datamengder vil kunne bruke lokale ressurser eller kjøpe kapasitet hos store skytjenesteleverandører. Dersom man velger leverandører som lagrer og behandler data i henhold til personvernforordningen, vil man kunne behandle de fleste ugraderte data i slike skytjenester. Bruk av skytjenester fra store, kommersielle aktører som Google, Amazon og Microsoft åpner for større tilgang til både kapasitet (lagrings- og regnekraft) og ulike kommersielt tilgjengelige analyseverktøy.

Dersom man skal behandle større datamengder, eller data som krever store parallelle beregninger, er imidlertid ikke dette tilstrekkelig. Da trenger man større regneressurser, som det er mer kostnadseffektivt å etablere på nasjonalt eller internasjonalt nivå. UNINETT AS utvikler og driver det norske høyhastighetsnettverket for forskning og utdanning. Datterselskapet UNINETT Sigma2 AS har ansvar for å anskaffe, drifte og vedlikeholde de nasjonale ressursene for tungregning og datalagring i Norge.

For enkelte forskningsområder, som astrofysikk og marin forskning, er datamengdene så store og kravet til hastighet i beregningene så høye at de ressursene vi har nasjonalt ikke har tilstrekkelig kapasitet. Da er vi avhengig av samarbeid og av å kjøpe kapasitet i internasjonalt samarbeidende konsortier. Slike tungregneanlegg kan ha opptil 10-100 ganger mer kapasitet enn nasjonale ressurser.

EU-kommisjonen tok i 2017 initiativet til å opprette det nye europeiske partnerskapet for tungregning, EuroHPC, der finansieringen kommer dels fra EU-kommisjonen og dels fra nasjonale bidrag. Norge deltar i EuroHPC, men fra 2021 vil fortsatt norsk deltakelse være avhengig av at Norge deltar i EU-programmene Horisont Europa og Programmet for et digitalt Europa (DEP). I Norge er UNINETT Sigma2 nasjonalt kompetansesenter for tungregning i EuroHPC-samarbeidet.

Tungregning gir viktig kunnskap om store samfunnsutfordringer

Livssyklusanalyser og materialflytsanalyser er sentrale elementer for å få oversikt over den totale miljøpåvirkningen av ulike produkter fra vugge til grav. Slike analyser krever både store datamengder og mye regnekraft. Når data fra havområdene kombineres med atmosfæremålinger, vil dette gi bedre datagrunnlag for klimamodellering. Klimamodellene krever stadig høyere oppløsning både i tid og rom, og dermed mer beregninger, for å kunne gi den nødvendige lokale innsikten i hvordan klimaendringene vil påvirke risikoen for flom, ras og ekstremvær.

På samme måte vil modellering av romvær være essensielt for å unngå lammelse av samfunnskritisk infrastruktur ved kraftige solstormer.

Innenfor helseforskning har det i de senere årene skjedd en revolusjon gjennom muligheten for gensekvensering og bruk av avanserte algoritmer, som igjen danner utgangspunktet for persontilpasset medisin og nye avanserte behandlingsformer. Metodene genererer store mengder sensitive data, som må analyseres med tungregnemaskiner og oppbevares meget sikkert.

Kilde: Kunnskapsdepartementet

Noen områder krever høy informasjonssikkerhet samtidig som dataene skal kunne behandles effektivt. Eksempler på dette kan være høyoppløselige MR-bilder, DNA-data, video av pasienter og andre sensitive data. Løsninger for lagring og behandling av slike data tilbys blant annet gjennom Tjenester for Sensitive Data (TSD) som drives og utvikles i et samarbeid mellom Universitetet i Oslo og UNINETT Sigma2.

Norske datasentre som ressurs for KI

For mange virksomheter er bruk av skytjenester en forutsetning for å kunne utnytte potensialet i kunstig intelligens. Gjennom skytjenester får de tilgang til regnekraft og rammeverk for maskinlæring som de ikke har tilsvarende tilgang til lokalt.

Det er mange faktorer som driver økningen i datamengde, blant annet tingenes internett og mulighet for å gjøre flere og mer avanserte analyser på sammensatte datakilder. Dette fører igjen til økt etterspørsel etter lagrings- og behandlingskapasitet «i skyen», noe som igjen fører til økt etablering av datasentre.

Regjeringen vil at Norge skal være en attraktiv nasjon for datasentre annet databasert næringsliv. I 2018 ble det derfor lagt frem en egen datasenterstrategi.23 Flere av tiltakene i strategien, som redusert elavgift for datasentre, fjerning av «maskinskatten» og tydeligere prosess for å regulere tomter til datasentre, har gjort Norge enda mer attraktivt for datasenterindustrien. I tillegg er ren kraft, gode kommunikasjonsveier og politisk og geologisk stabilitet viktige argumenter for å etablere datasentre i Norge.

Det har vært en økt etablering av datasentre i Norge de siste årene. Flere av de norske datasentrene har store, internasjonale kunder, og flere store internasjonale skytjenesteleverandører har valgt å etablere egne datasentre i Norge. Vi ser også en tendens til at kunder – også flere internasjonale selskap – flytter oppgaver som krever mye regnekraft til norske datasentre, fordi disse kan tilby skalerbar kapasitet basert på fornybar energi. Dette er positivt fra et næringsperspektiv, og det gir norsk næringsliv og offentlig sektor større valgfrihet i valg av leverandører. Dette er spesielt viktig for de virksomhetene som har strenge krav til tidsforsinkelse eller behandler data med krav til nasjonal lagring og behandling.

Regjeringen vil

  • vurdere hvordan det kan legges til rette for økt bruk av anonymiserte metadata fra mobilnettene
  • legge frem forslag til lov om bredbåndsutbygging, som skal bidra til økt utbyggingstakt for høyhastighetsnett i Norge
  • legge til rette for rask utbygging av 5G
  • legge frem en melding til Stortinget om elektronisk kommunikasjon
  • vurdere videre deltakelse i EuroHPC i sammenheng med Horisont Europa og Programmet for et digitalt Europa (DEP)
  • etablere en markedsplass for skytjenester, som blant annet skal veilede offentlige virksomheter i anskaffelse av skytjenester, med særlig fokus på sikkerhet
  • følge opp datasenterstrategien «Norge som datasenternasjon»


Fotnoter

6.

Kommunal- og moderniseringsdepartementet (2019): Én digital offentlig sektor. Digitaliseringsstrategi for offentlig sektor 2019-2025

7.

Meld. St. 27 (2015-2016) Digital agenda for Norge — IKT for en enklere hverdag og økt produktivitet

8.

Kunnskapsdepartementet (2017): Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata

9.

Veritas Technologies LLC (2015): The Databerg report. See whatothersdon't.

10.

Oljedirektoratet (2015): Diskos 20 år i oljegeologiens tjeneste. www.npd.no/globalassets/3-diskos/documents/diskos_jubileumshefte_liten.pdf

11.

www.geonorge.no/Geodataarbeid/Norge-digitalt/

12.

Prinsippene er inspirert av: Dutch Ministry of Economic Affairs and Climate Policy (2019): Dutch vision on data sharing between businesses.

13.

RAIRD Information Model RIM v1_0 på https://statswiki.unece.org/display/gsim/RAIRD+Information+Model+RIM+v1_0

14.

Ot.prp. nr. 108 (2000-2001) Om lov om endringer i diverse lover for å fjerne hindringer for elektronisk kommunikasjon

15.

Kommunal- og moderniseringsdepartementet (2019): Én digital offentlig sektor. Digitaliseringsstrategi for offentlig sektor 2019-2025

16.

Helse- og omsorgsdepartementet (2019): Høring - tilgjengeliggjøring av helsedata (endringer i helseregisterloven m.m.)

17.

LOV-2017-12-15-112 Lov om utprøving av selvkjørende kjøretøy

18.

Sjøfartsdirektoratet (2017): Horten blir testområde for autonome skip. www.sdir.no/

19.

LOV-2019-06-21-70 Lov om havner og farvann (havne- og farvannsloven) §25.

20.

NOU 2019: 9 Fra kalveskinn til datasjø — Ny lov om samfunnsdokumentasjon og arkiver

21.

NOU 2019: 5 Ny forvaltningslov — Lov om saksbehandlingen i offentlig forvaltning (forvaltningsloven)

22.

Telia (2019): Telia skal bygge ut et nasjonal 5G-nett i løpet av 2023. Pressemelding 8. oktober 2019

23.

Nærings- og fiskeridepartementet (2018): Norge som datasenternasjon. Strategi