3 Økt deling av data og verdiskaping

Fokus på nytt livsløp, bestefar med barnebarn og hund på bytur, Tegnet strek omfavner mannen og fører til symbolet «dødsfall og arv». Streker trukket som nettverk mellom øvrige symboler, viser samspill mellom etatene.
Brukerne skal unngå å oppgi informasjon som det offentlige allerede har innhentet. Økt deling av data er også en forutsetning for utvikling av sammenhengende tjenester på tvers av sektorer og forvaltningsnivåer. Offentlig sektor skal dele data når den kan og skjerme data når den må. Åpne offentlige data skal gjøres tilgjengelig for viderebruk til utvikling av nye tjenester og verdiskaping i næringslivet.

Data er en ressurs som kan utnyttes bedre. All offentlig oppgaveløsning og tjeneste­utvikling innebærer bruk av data. Måten vi utnytter data på er i stor endring, og åpner for helt nye måter å løse oppgaver på. Økt deling av data er også en forutsetning for mer sammenhengende og skreddersydde tjenester til brukerne. Innbyggere, næringsliv og frivillige organisasjoner skal møte én digital offentlig sektor. Digital agenda for Norge slår fast prinsippet om at forvaltningen skal gjenbruke informasjon i stedet for å spørre brukerne på nytt om forhold de allerede har ­opplyst om – «kun-én-gang»-prinsippet.

Det skal legges bedre til rette for viderebruk av åpne data. Viderebruk av offentlig informasjon handler om å gi næringsliv, forskere og sivilsamfunn tilgang til åpne data fra offentlig sektor på en måte som gjør at de kan brukes i nye sammenhenger, skape nye tjenester og gi økt verdiskaping.

Hvor er vi?

For å nå målsettingen i Digital agenda om «kun én gang» er det startet et arbeid med «orden i eget hus». «Orden i eget hus» er pålagt statlige virksomheter gjennom Digitaliseringsrundskrivet. For å kunne gjenbruke data fra andre i saksbehandling og annen oppgaveløsning, må virksomhetene først vite at dataene finnes, hvor de befinner seg og hva de kan brukes til. «Orden i eget hus» innebærer god informasjonsforvaltning, og det er laget en egen veileder om dette.9 «Orden i eget hus» er også helt avgjørende for en forsvarlig ivaretakelse av personvernet. I tillegg til å vite hvor dataene er og hvordan de kan brukes i praksis, må virksomhetene ha et rettslig grunnlag for gjenbruk gjennom lovhjemmel eller samtykke.

Økt tilgjengeliggjøring av åpne offentlige data har de siste årene vært et prioritert tiltak. Offentleglova gir alle en rett til å viderebruke informasjon som er offentlig, på visse vilkår. Det er etablert en nasjonal felles datakatalog. Felles datakatalog er en oversikt over hvilke data de ulike offentlige virksomhetene har, hvordan de ­henger sammen og hva de betyr. Felles datakatalog er første steget på veien mot målet om «kun én gang».

Krav i Digitaliseringsrundskrivet og retningslinjer ved tilgjengeliggjøring av offentlige data, følges imidlertid opp i for liten grad av de statlige virksomhetene. Ved årsskiftet 2018/2019 hadde kun ca. 20 prosent av statlige virksomheter publisert ett eller flere datasett på www.data.norge.no, som er en del av Felles datakatalog. Det antas at kun ca. 10 prosent av relevante datasett er gjort tilgjengelig. For kommunene er det ingen spesielle føringer som gjelder viderebruk av data utover bestemmelsene i offentleglova.

Offentlige og private virksomheter som ønsker å viderebruke offentlige data som ikke allerede er publisert på www.data.norge.no, må be om innsyn i data som offentlige virksomheter proaktivt kunne gjort tilgjengelig og synliggjort som åpne data. Manglende beskrivelser av åpne data fra offentlig sektor reduserer synlig­heten for potensielle brukere av dataene. Norge faller også på flere internasjonale barometre for åpne data. Situasjonen er bedre på enkeltområder, blant annet blir geodata publisert via www.geonorge.no som oppfølging av geodataloven, og transport­data blir publisert på vegvesen.no. Disse databeskrivelsene blir importert i ­Felles datakatalog.

Boks 3.1 Felles datakatalog

Felles datakatalog er en oversikt over hvilke data de ulike offentlige virksom­hetene har, hvordan de henger sammen og hva de betyr. Datakatalogen gjør det mulig å søke i opplysningene hos offentlige virksomheter. Datakatalogen vil gjøre det enklere for offentlige og andre virksomheter å gjenbruke informasjon som allerede finnes. Felles datakatalog inneholder per juni 2019, 1259 datasett, 20 API-er, 3326 begreper og 577 informasjonsmodeller.10

Boks 3.2 Gårdskart – https://gardskart.nibio.no

Gårdskart viser arealressurser og arealtall for én enkelt landbrukseiendom. Det er ikke et eget kart, men satt sammen av informasjon fra flere kilder. Løsningen benytter data i sann tid fra flere kilder, og gir næringsdrivende og ansatte i forvaltningen tilgang til de samme opplysningene. Gårdskart understøtter bondens arbeid med driftsplanlegging, dokumentasjon og søknader, samtidig som det effektiviserer saksbehandlingen i landbruksforvaltningen. Tjenesten er tilrettelagt for landbruksforvaltningen og eiere og brukere av landbrukseiendommer, men er åpen for alle.

Hvor skal vi?

Arbeidet som er blitt gjort innenfor informasjonsforvaltning har gitt oss et godt fundament for å etablere felles oversikt over hvilke data som finnes, hva de betyr, og hvordan de kan deles. Fremover vil verdien av de nasjonale datakatalogene, ­Felles datakatalog og data.norge.no, være avhengig av at virksomhetene gjør sin del av jobben i form av å etablere «Orden i eget hus». Dette innebærer å beskrive egne data, begreper, informasjonsmodeller og API-er, og å aktivt dele data i tråd med nasjonale retningslinjer. I tillegg er det behov for nye grep for å øke takten i arbeidet og oppnå målene.

Det er behov for økt kompetanse om regelverk og rammer for deling av data, om sammenhenger mellom jus og teknologi og mellom forretnings- og forvaltnings­modeller. Det er også behov for mer kunnskap om hvordan infrastrukturen, både i statlig og kommunal sektor, kan tilrettelegges for deling av data. Det er behov for en arena som kan bistå dataeiere og databrukere på dette området, og tilrettelegge for erfaringsutveksling i offentlig sektor. En slik arena vil være viktig i forbindelse med utvikling av sammenhengende tjenester, tverrgående digitaliserings­prosjekter og arbeidet med et mer digitaliseringsvennlig regelverk.

Deling av data må skje innenfor rammene av lovverket generelt, og innenfor rammene av personvernregelverket spesielt. All bruk av personopplysninger krever et rettslig grunnlag etter personvernforordningen artikkel 6. Behov for regelverksendringer må eventuelt vurderes konkret når behovet for deling av data oppstår, som for eksempel ved utvikling av sammenhengende tjenester der deling av data mellom virksomheter er aktuelt. Ivaretakelse av personvernet for brukeren innebærer blant annet at dataene som benyttes i en tjeneste har riktig kvalitet og at brukeren vet hvor informasjonen er hentet fra. En forutsetning for deling av data er også at dataene er egnet til å gjenbrukes: gjenbruk må ikke være uforenlig med det opprinnelige formålet med innhentingen av dataene og det må være samsvar mellom begrepene som benyttes.

For ikke å komme i utakt med befolkningens ønsker og behov, må offentlig sektor i større grad kunne ta i bruk de nyeste teknologiene, som for eksempel kunstig intelligens og tingenes internett. Den nye teknologien kan brukes til å utvikle et bedre offentlig digitalt tjenestetilbud som oppleves som mer relevant og tilpasset den enkelte innbyggers og virksomhets behov. En slik tilpassing vil dessuten være viktig for utviklingen av morgendagens arbeidsplasser og for å sikre et mer bærekraftig velferdssamfunn.

Boks 3.3 Økt deling av data i plan- og byggesaksprosesser

For privatpersoner og næringsdrivende som skal søke kommunen om å bygge, er det krevende å etterkomme informasjonskravene i regelverket. Både søker og kommunen har behov for tilgang til data fra en rekke sektormyndigheter, i tillegg til kommunens egne plandata, matrikkeldata mv. For å kunne ta ut gevinstene ved en fulldigital byggesaksprosess må relevante data tilrettelegges for digital selvbetjening.

Direktoratet for byggkvalitet har gjennom Fellestjenester BYGG etablert infrastrukturen for fulldigital byggesaksbehandling, fra søknadsutfylling til kommunens vedtak i byggesak. Fellestjenester BYGG er en digital regelverksplattform som kontrollerer og sender inn byggesøknader til riktig kommune.

Kommunal- og moderniseringsdepartementet har gjennomført en femårig satsing på mer digitale planprosesser hvor et av målene er å få mer enhetlige og entydige digitale plankart som samsvarer med planbestemmelsene, samt å utvikle digitale planbestemmelser. Dette vil føre til raskere og enklere byggesaksbehandling i kommunene. Departementet skal lage en digital verktøykasse for enklere og mer enhetlig håndtering av digitale arealplansaker for aktørene.

KS har i samarbeid med KMD og kommunene utviklet et nytt hjelpemiddel for kommunene, ePlanSak. Dette er en produktspesifikasjon som kommunene kan benytte når de skal digitalisere planprosessen og anskaffe nye fagsystem.

En grunnleggende forutsetning for å dele data er at vi vet hvilke data som finnes hvor, hva de betyr og hvorvidt dataene kan deles. En fysisk infrastruktur for deling av data vil gjøre det enklere for virksomhetene å vurdere muligheter for deling av data og tilrettelegge for selve delingen. Dette arbeidet er komplekst for en virksomhet å gjøre alene. Felles problemstillinger og behov kan ivaretas bedre gjennom en mer sentral og koordinert oppgaveløsning. Enkelte aktører påtar seg å distribuere data fra en eller flere datatilbydere til mange datakonsumenter. Noen datatilbydere har opprettet, eller er i prosess med å opprette, løsninger hvor flere datakonsumenter kan koble seg til. For eksempel, Statens vegvesens webtjenester Kjøretøyopplysninger eller den planlagte Helseanalyseplattformen til Direktoratet for e-helse. For kommunal sektor som forvaltningsnivå er FIKS (KS) etablert som delingsplattform. Det finnes også flere sektorvise delingsplattformer, herunder PEPPOL (Difi) og Nye Feide, og det finnes en datafordeler for eBevis i Altinn.

Boks 3.4 Skatteetaten og a-ordningen

A-ordningen er en samordnet måte for arbeidsgivere å rapportere opplysninger om inntekt og ansatte til NAV, SSB og Skatteetaten. Ordningen er digital. Opplysningene blir sendt elektronisk, enten via arbeidsgivers lønnssystem eller via en tjeneste i Altinn. Skatteetaten forvalter ordningen på vegne av de andre etatene. Hensikten er å forenkle og samordne arbeidsgivers rapportering. Samtidig er det et betydelig potensiale for å gjenbruke disse opplysningene i offentlig saksbehandling og i privat sektor. Opplysningene kan distribueres bare til private og offentlige aktører som etter samtykke fra innbygger eller med hjemmel i lov kan motta dem. Økt etterspørsel etter disse opplysningene utfordrer Skatteetatens eksisterende kjernevirksomhet og stiller andre krav til etatens forvaltning, oppe­tider, sikkerhetsnivåer mv. fordi andre myndigheter og private blir avhengig av opplysninger som Skatteetaten forvalter. Skatteetaten har laget en policy for deling av data slik at etaten skal kunne styre den økte etterspørselen.

Boks 3.5 eBevis

eBevis forenkler anskaffelsesprosessene ved at tilbydere slipper å legge frem dokumentasjon med opplysninger som det offentlige allerede har, for eksempel Skatteattest. Der oppdragsgiver har et rettslig grunnlag (hjemmel eller samtykke), kan informasjonen hentes direkte fra datakildene, sammenstilles og leveres til de offentlige oppdragsgiverne. eBevis er utviklet slik at løsningen også kan brukes til andre liknende formål.

I tillegg til sektorvise delingsplattformer er det behov for å utrede utvikling av felles metodikk, prinsipper og rammeverk for en generisk «datafordeler». En slik generisk metodikk kan tas i bruk for konkrete datadelingstjenester. En sentral datafordeler vil kunne fordele data fra en eller flere datatilbydere til datakonsumenter med like behov, med regulerte roller og ansvar mellom partene som deler data. A-ordningen inneholder opplysninger som flere kommunale tjenester har behov for. Det er imidlertid nødvendig å avklare det rettslige grunnlaget for slik gjenbruk av opplysninger – og videre foreta en semantisk gjennomgang av dataene slik at riktige opplysninger kan innhentes av riktig tjeneste. For å få til dette må det blant annet utvikles APIer (datauthentingsgrensesnitt) som kan sikre nødvendig datakvalitet for data til bruk i de aktuelle kommunale tjenestene. Utvikling av et rammeverk for en slik datafordelingstjeneste er det første skrittet på veien mot etablering av ­konkrete tjenester (plattformer) for fordeling av data til flere aktuelle konsumenter. KS i ­samspill med medlemmene vil være en viktig aktør i et slikt arbeid.

Det produseres stadig mer informasjon. De potensielle samfunnsmessige gevinstene ved bruk av stordata er store. Dersom forholdene blir lagt til rette for det kan utnyttelse av stordata lede til gevinster i mange sektorer, gi muligheter for effektivisering av offentlig sektor generelt og videreutvikling av tjenestetilbud som er mer tilpasset brukernes behov.11 Fremtidens krav og muligheter kan ikke løses eller utnyttes med gårsdagens metoder og verktøy. En datasjø er en metode for lagring av alle former for data og kan sammenliknes med et sentralt datalager for alle typer data: strukturerte og ustrukturerte, både dokumenter og logger, bilder, lyd og video. En datasjø vil være en kilde til alle data innenfor et område med mulighet for tilgang for flere, og et verktøy for effektivisering; læring, planlegging, utforsking av muligheter og et viktig grunnlag for maskinlæring og kunstig intelligens. En datasjø kan bygges internt i en virksomhet eller som en felles løsning for flere virksomheter – eller for en hel sektor. En datasjø kan legge til rette for effektiv og standardisert datadeling, med sikre tilgangsmekanismer.

Det finnes i dag noen eksempler på datasjøer der data kan samles og analyseres ved hjelp av eksempelvis kunstig intelligens. Slike datasjøer er opprettet, eller er under opprettelse, hos blant annet Direktoratet for e-helse (Helseanalyseplatt­formen) og Bergen kommune (Lungegårdsvannet).

Difi har gjennomført en konseptvalgutredning som beskriver dagens situasjon og fremtidige ambisjoner for deling av offentlige data. Etablering av datafordeler, datasjø og et nasjonalt ressurssenter for deling av data er sentrale anbefalinger i utredningen.12

Boks 3.6 Bergen kommunes datasjø – Lungegårdsvannet

Bergen kommune har i 2018 etablert en datasjø som skal inneholde data fra mange forskjellige fagområder og virksomheter i kommunen, og som kan deles med andre deler av kommunen og med næringslivet. Det er tatt initiativ til å etablere et samarbeid for kommunal sektor med hensikt å bygge videre på og videreutvikle erfaringene fra Bergen. Dette vil sees i sammenheng med statlig arbeid på området.

Arbeidet med informasjonsforvaltning må systematiseres og harmoniseres slik at det gir en bedre oversikt over registre og grunndata, og hvilke data som kan være gjenstand for deling. Kvalitativt gode data er en forutsetning både for oppfyllelse av personvernlovgivningen og for god utnyttelse av maskinlæring og kunstig intelligens.

Kunstig intelligens (KI) vil sette oss i stand til å få ny kunnskap fra de store informasjonsmengdene vi har i offentlig sektor, og bidra til at vi kan løse oppgaver på nye måter. Men bruk av kunstig intelligens i offentlig sektor reiser også vanskelige spørsmål rundt åpenhet, ansvar, rettssikkerhet og personvern.

Boks 3.7 Lånekassen og kunstig intelligens

Lånekassen har hatt gode erfaringer med å bruke maskinlæring til å plukke ut kandidater for såkalt «bokontroll» – det vil si kontroll av bostedsadresse for kunder med status borteboere for å undersøke om adressen er en annen enn foreldrenes adresse. Lånekassens bokontroll i 2018 omfattet 25 000 studenter. 15 000 ble plukket ut ved kunstig intelligens (maskinlæring), mens 10 000 ble plukket ut som vanlig, ved tilfeldig utvalg (kontrollgruppe). Resultatene viser at kunstig intelligens gjør det lettere å finne de som ikke er reelle borteboere. 5,5 prosent i kontrollgruppa og 11,6 prosent i maskinlæringsgruppa besto ikke bokontrollen. Det betyr at Lånekassen kan slippe å kontrollere de som med svært stor sannsynlighet er reelle borteboere og som dermed har rett til omgjøring til utdanningsstipend. Det betyr at færre studenter må sende inn dokumentasjon, noe som også betyr mindre saks­behandling hos Lånekassen. Studentene som ble plukket ut måtte dokumentere at de bodde borte fra foreldrene sine i 2017, slik de hadde oppgitt til Lånekassen.

Regjeringen har besluttet å lage en nasjonal strategi for kunstig intelligens. Strategien skal blant annet se på:

  • hvordan vi bør innrette oss innen utdanning og forskning for å kunne bygge opp avansert kompetanse innen KI i Norge
  • hvordan vi kan ta i bruk KI i offentlig sektor
  • hvordan utviklingen av KI kan påvirke arbeidslivet
  • behov for grunnleggende digital kompetanse, samt etter- og videreutdanning
  • hvordan norsk næringsliv kan utnytte den kommersielle kraften i KI

Viktige forutsetninger for at Norge skal kunne utnytte KI er infrastruktur i form av bredbånd og 5G (femte genererasjons mobilnett), regnekraft, og ikke minst innsamling, strukturering og tilgjengeliggjøring av data.

Boks 3.8 Nasjonalbiblioteket og kunstig intelligens

Nasjonalbiblioteket har jobbet med å digitalisere sine samlinger gjennom mange år og har nå en stor samling digitalt materiale som består av blant annet bøker, artikler, radio- og tv-sendinger. Dette gir et svært godt grunnlag for å skape nye løsninger for maskinlæring og kunstig intelligens. Nasjonalbiblioteket er, som det første biblioteket i verden, i ferd med å utvikle sin egen kunstige intelligens, Nancy. Nancy baserer seg på programvare som finnes i markedet. Nancy vil kunne effektivisere arbeidsprosessene ved mottak av materiale, ved å katalogisere og klassifisere innholdet i materialet på egen hånd.

Nasjonalbiblioteket har store mengder lyd og video som er avlevert blant annet fra NRK. Denne delen av samlingen er i dag ikke indeksert og dermed nesten umulig å finne frem i, med mindre man allerede vet nøyaktig hvor man skal lete. Kunstig intelligens gjør det mulig å gjøre tekstbaserte søk i radio- og tv-sendinger.

Boks 3.9 Språkteknologi

Språkteknologiske produkter og tjenester på norsk er en grunnleggende komponent i digitaliseringen av det offentlige. Språkbanken er en tjeneste i Nasjonal­biblioteket som inneholder tekst- og taleressurser til bruk i utvikling av språk­teknologi på norsk. Felles for mange språkteknologiske løsninger er at de trenger en stor mengde ferske og områdespesifikke data for å fungere optimalt. Det er en utfordring å sikre avlevering av ressurser til språkbanken.

Regjeringen vil:

  • Etablere et nasjonalt ressurssenter for deling av data med spisskompetanse på sammenhengen mellom juss, teknologi, forretnings- og forvaltningsprosesser som læremiljø og kompetansebank for hele offentlig sektor
  • I samarbeid med KS vurdere å benytte eksisterende datasjøer (samlinger av store datamengder), herunder regionale og virksomhetsinterne datasjøer, som skal kunne understøtte dataanalyser og tjenesteutvikling
  • I samarbeid med KS utrede en generisk datafordeler som blant annet innebærer kunnskap og metodikk for hvordan data kan deles på en forsvarlig måte gjennom å fastsette prinsipper for ansvar, kostnadsdekning og gevinstuttak
  • Utrede mulig plikt til å publisere åpne offentlige data
  • Utarbeide en nasjonal strategi for kunstig intelligens
    Fokus på nytt livsløp, person som ser ned i mobilen. Tegnet strek omfavner mannen og fører til symbolet «Miste og finne jobb». Streker trukket som nytt nettverk mellom øvrige symboler, viser samspill mellom etatene.

Fotnoter

11.

Kartlegging og vurdering av stordata i offentlig sektor, Vivento AS og Agenda Kaupang AS, 2015