NOU 2023: 1

Kvalitetsvurdering og kvalitetsutvikling i skolen — Et kunnskapsgrunnlag

Til innholdsfortegnelse

13 Styrker og utfordringer med dagens kvalitetsvurderingssystem

I dette kapitlet redegjør utvalget for styrker og utfordringer med dagens kvalitetsvurderingssystem. Utvalget har vurdert styrker og utfordringer med systemet med utgangspunkt i formålet med systemet og de ulike delene av det.

13.1 Bidrar kvalitetsvurderingssystemet med like nyttig informasjon til alle aktørene?

Formålet med informasjonen fra kvalitetsvurderingssystemet har fra innføringen av vært å støtte både styring og kvalitetsutvikling på alle nivåer. Det skulle likevel først og fremst være et virkemiddel for den enkelte skole og skoleeierne (Meld. St. 30 (2003–2004); Meld. St. 31 (2007–2008)).

Skoleeierne og de nasjonale myndighetene bruker informasjon fra kvalitetsvurderingssystemet til å følge med på utviklingen i skolene og for å vurdere om det er behov for å iverksette- eller avvikle tiltak.

Flere innspill til utvalget viser til at dagens kvalitetsvurderingssystem gir viktig informasjon. Dette mener blant annet Utdanningsdirektoratet, statsforvalterne, Norsk Lektorlag, Nasjonalt senter for samisk i opplæringa ved Samisk høgskole og Statped. Innspillene peker samlet på at det er viktig at kvalitetsvurderingssystemet bidrar med noen felles stoppunkter for å vurdere kvaliteten gjennom opplæringen.

Andre innspill utvalget har mottatt, understreker styrken i at kartleggingsprøvene, de nasjonale prøvene og de internasjonale undersøkelsene bidrar med kvalitetssikret informasjon om utvalgte fag og ferdigheter. Dette kommer blant annet fram i innspill fra nettverket for Aggregerte Styringsdata for Samarbeidende Storkommuner (ASSS-nettverket) og Grunnskolenettverket i KS. Barneombudet peker på at informasjon fra kvalitetsvurderingssystemet er nødvendig for å sikre barns rettigheter. Norsk Lektorlag understreker betydningen av eksamen i den videregående opplæringen hvor det er få andre målepunkter, både som dokumentasjon på elevenes kompetanse og som en ekstern kvalitetskontroll av fag.

Det har samtidig ved flere anledninger blitt stilt spørsmål ved hvor godt systemet lykkes i å være orientert mot lærernes og skolenes behov for å drive lokal kvalitetsvurdering og kvalitetsutvikling, eller om kvalitetsvurderingssystemet er mer rettet mot myndighetenes behov for styringsdata (Allerup mfl., 2009; Nusche mfl., 2011; Aasen mfl., 2012).

Det har blitt pekt på at det finnes en spenning mellom oppfatningene om kvalitetsvurderingssystemet som et statlig styringsverktøy og som støtte til utviklingsarbeid i skolen (Ekspertgruppe om lærerrollen, 2016; Mausethagen mfl., 2018b; Seland mfl., 2013). Ekspertgruppen for skolebidrag peker på at en kort tradisjon for arbeid med kvalitetsutvikling innebærer kort tid til å utvikle kunnskap og kompetanse på området. Uenigheter om hvorvidt systemets formål er kontroll eller utvikling kan føre til usikkerheter, og usikkerheter kan gjøre rolle- og ansvarsfordelingen utydelig og påvirke handlingskompetansen til de som skal utføre arbeidet med kvalitetsutvikling i skolen (Ekspertgruppe for skolebidrag, 2021).

Flere lokallag i Utdanningsforbundet peker i innspill til utvalget på at de opplever at systemet først og fremst fungerer som en kontrollfunksjon. Lokallagene som har gitt innspill mener det er for mye kartlegging i skolen uten at det har en tydelig hensikt og uten at resultatene lar seg bruke i konkret utforming av pedagogisk praksis. Utdanningsforbundets lederråd peker i sitt innspill på at de opplever at det er for mye styring basert på tallene og for lite rom for intern utvikling. De opplever at de bruker mye tid på å samle inn informasjon som ikke nødvendigvis gir så mye tilbake til det pedagogiske arbeidet i klasserommet, og nevner nasjonale prøver som eksempel. Lederrådet beskriver også en opplevelse av et system som stadig ekspanderer, og peker på at mange skoleeiere fyller på med undersøkelser utover for eksempel Elevundersøkelsen.

Hvordan ivaretar dagens prøver og undersøkelser flere formål?

Formålet med de nasjonale prøvene og Elevundersøkelsen er å gi informasjon til alle nivåer i skolesektoren (se kapittel 8). Én og samme prøve eller undersøkelse skal gi informasjon om elever som kan brukes til å planlegge undervisning og følge opp skole- og læringsmiljø på skolenivå. Samtidig skal undersøkelsen gi informasjon til skoleeiere og nasjonale myndigheter. Dette gir noen fordeler, men innebærer også flere kompromisser for blant annet hvordan en prøve eller undersøkelse blir utformet, og dermed hvilken informasjon disse kan gi ulike aktører. Dette kan skape problemer, for eksempel ved at formålene vektes ulikt av ulike aktører i utdanningssektoren eller at resultatene brukes på feil måter. En prøve med ett avgrenset formål vil sannsynligvis måle mer målrettet (Bjórnsson, 2022).

På den annen side kan det være noen fordeler med at de nasjonale prøvene og Elevundersøkelsen gir informasjon til å følge opp elever og kvalitetsutvikling lokalt, i tillegg til å gi styringsinformasjon til lokale og nasjonale myndigheter. Det kan bidra til å redusere det totale antallet prøver og undersøkelser i kvalitetsvurderingssystemet. I Kunnskapsdepartementets strategi om kvalitetsutvikling fra 2021 blir det også påpekt at det er et poeng å unngå unødvendig mange målinger. Der går det fram at det er viktig at elevene, lærerne og skolelederne ikke opplever summen av kartlegginger, rapporteringer og bruken av verktøy og ressurser som er utviklet både lokalt og nasjonalt som en unødvendig belastning (Kunnskapsdepartementet, 2021b).

En annen fordel med at en og samme prøve eller undersøkelse kan gi informasjon til flere aktører samtidig, kan være å dempe eventuelle utilsiktede konsekvenser som kan oppstå gjennom å ha egne prøver som bare skal bidra med informasjon til styringsnivåene på lokalt og nasjonalt nivå. Prøver som har styring som eneste formål, kan bli oppfattet som prøver med store konsekvenser for skolene, og kan medføre uheldige tilpasninger. På denne måten kan et såkalt dobbelt formål forstås som et kompromiss som dekker ulike behov og gir et felles utgangspunkt for å vurdere noen sider av skolens kvalitet for aktører på ulike nivåer (Bjórnsson, 2022).

På en annen side viser flere studier at et slikt dobbelt formål kan være spesielt utfordrende å håndtere (Gunnulfsen, 2019; Mausethagen, 2013b; Mausethagen mfl., 2018b). Det kan blant annet være vanskelig å koble analyser av elev-resultater til mer langsiktig utviklingsarbeid. Dessuten kan styringsaspektet ta oppmerksomheten vekk fra den utviklingsfunksjonen prøvene er tiltenkt (Skedsmo, 2022).

Det doble formålet med nasjonale prøver kan også gi skoleledere en vanskelig rolle når de på den ene siden skal balansere det å følge opp og bruke resultatene til politiske og administrative forventninger om kontroll fra kommunenivået og på den andre siden bevare relasjoner og et godt arbeidsmiljø på skolen ( Mausethagen mfl., 2019). Det kan stilles spørsmål ved om dette doble formålet virker hemmende for en kreativ kunnskapsutvikling og formativ utvikling av skolens praksis (Hermansen og Mausethagen, 2016), eller om den eventuelt kan virke fremmende. I så fall vil det være hensiktsmessig å undersøke hvordan en hemmende eller fremmende praksis utspiller seg (Vestheim, 2018).

I innspill til utvalget trekker Utdanningsforbundets lederråd fram at de mener de nasjonale prøvene på mange måter gir veldig mye data til forskerne og myndighetene, men «lite» tilbake til skolene i forhold til tiden skolene bruker på det.

13.2 Er det helhet og sammenheng i dagens kvalitetsvurderingssystem?

En gjennomgang av den politiske diskursen om kvalitetsvurderingssystemet i Norge viser hvordan formålet har endret seg fra Utdanningsminister Kristin Clemet og Bondevik II-regjeringen (2001–2005) via Djupedal, Solhjell og Halvorsen i Stoltenberg II-regjeringen (2005–2013) og Røe Isaksen, Sanner, Skei Grande og Melby i Solberg-regjeringen (2013–2021) til dagens Støre regjering med Kunnskapsminister Tonje Brenna-(fra 2021). Med fire ulike regjeringer og ni ulike ministere, har formålet med kvalitetsvurderingssystemet generelt og nasjonale prøver spesielt endret seg. Dette går blant annet fram av hvordan kvalitetsvurderingssystemet har blitt framstilt gjennom de siste årene (Hopfenbeck, 2022). Tidlig i perioden viste for eksempel Kristin Clemet til at plasseringen av nasjonale prøver på 10. trinn gjorde at man «(…) fikk mest mulig informasjon om hvordan de enkelte skolene fungerte læringsmessig». Uttalelsen kunne tolkes som at skolene skulle holdes ansvarlige for elevenes resultater. Under Øystein Djupedal ble dette endret da de nasjonale prøvene ble flyttet til 5. og 8. trinn «(…) for å styrke prøvenes formative funksjon». I 2015 uttalte Torbjørn Røe Isaksen at «(…) hensikten med nasjonale prøver først og fremst er å gi lærerne et godt verktøy for å gi bedre opplæring til den enkelte elev» (Hopfenbeck, 2022).

I flere omganger har det blitt pekt på at det er uklart hva formålet med kvalitetsvurderingssystemet er, hvor avgrensningen mellom et nasjonalt system og frivillige verktøy og andre lokale kilder går og om det virkelig er et «system» (Allerup mfl., 2009; Nusche mfl., 2011).

De ulike prøvene, verktøyene og datakildene i kvalitetsvurderingssystemet har blitt innført som enkeltkomponenter på ulike tidspunkter og med ulike begrunnelser og formål. Det har blitt stilt spørsmål ved om dette kan være en underliggende årsak til at kvalitetsvurderingssystemet har blitt karakterisert som fragmentert og lite sammenhengende. Det har for norsk skole blitt utviklet mange målinger som hver for seg har god kvalitet, men de enkelte målingene i kvalitetsvurderingssystemet er fremdeles løsrevet fra hverandre. Det mangler også en helhetlig analyseramme som gjør det mulig å se de enkelte målingene i sammenheng (Blömeke og Olsen, 2018).

Utdanningsdirektoratet peker i sitt innspill på at de får tilbakemeldinger fra skoler og skoleeiere om at de opplever verktøy og annen støtte direktoratet tilbyr til kvalitetsutviklingsarbeidet som lite sammenhengende. De skriver videre at dette er noe de arbeider med å tydeliggjøre. Det er blant annet gjort et større arbeid med nettsidene deres1 høsten 2022 hvor de frivillige verktøyene og andre støtteressurser, til kvalitetsutviklingsarbeidet blir presentert. Utdanningsdirektoratet peker på at det er en stor utfordring å skape en helhet og sammenheng i kvalitetsvurderingssystemet. Spesielt viser direktoratet at det er en utfordring å gi støtte til alle skoleeiere når de har veldig ulike behov. Direktoratet understreker at det er behov for å tenke nytt når det gjelder kvalitetsutvikling og formidling, gitt omfattende endringer blant annet på det digitale.

Bidrar innholdet i kvalitetsvurderingssystemet til målforskyvning?

Innholdet i kvalitetsvurderingssystemet har av flere blitt kritisert for å bidra til målforskyvning. Målforskyvning innebærer at adferden i en virksomhet vris i en retning som gir uønskede virkninger. Det som vurderes i et skolesystem, blir også vektlagt i undervisningen (Hopfenbeck, 2022).

Noe av formålet med kvalitetsvurderingssystemet har fra nasjonale myndigheter sin side vært å påvirke skolene og skoleeierne i en ønsket retning. Blant annet ble nasjonale prøver innført fordi det var og er et høyt prioritert mål at elevene har gode lese, og regneferdigheter. Gjennom prøvene kan elever og lærere få informasjon om elevenes ferdigheter, og dermed få et utgangspunkt for å vurdere hvilke grep som kan bidra til en god utvikling videre for eleven (Lie, 2012). Kunnskapsdepartementet viser til at de grunnleggende ferdighetene lesing og regning er avgjørende for å lære og utvikle seg i alle fag, for å vise faglige kompetanse, for videre utdanning og for aktiv deltakelse i arbeids- og samfunnslivet (Meld. St. 21 (2016–2017)).

Innføringen av prøver i grunnleggende ferdigheter gjennom kvalitetsvurderingssystemet har bidratt til at lesing står på dagsordenen i de fleste kommuner (Frønes mfl., 2012). Med nasjonale prøver i lesing kan det se ut som om vektleggingen på lesing har økt, også etter den første leseopplæringen (Hopfenbeck, 21022). De nasjonale prøvene i lesing medvirker også til å gi samiske lærere en arena hvor de kan diskutere ulike sider ved leseopplæringen på samisk (Henriksen mfl., 2018). Arbeidet med nasjonale prøver i lesing på samisk bidrar til til å sette samiske språk på dagsordenen. Det kan på sikt bidra til å høyne statusen for samisk som språkfag og som opplæringsspråk (Henriksen mfl., 2018).

Boks 13.1 Nasjonale prøver i lesing på samisk i et internasjonalt perspektiv

Forskere ved Senter for samisk i opplæringa ved Samisk høgskole mener de samiske nasjonale leseprøvene i Norge er unike i internasjonal sammenheng. Henriksen mfl., (2018) omtaler blant annet hvordan andre land gjennomfører leseprøver på minoritetsspråk eller urfolksspråk. Forskerne skriver at de ikke kjenner til eksempler på gjennomføring av leseprøver på andre minoritets- eller urfolksspråk, hvor språkenes samfunnssituasjon er sammenliknbar med situasjonen for de samiske språkene.

Samiskspråklige elever i Sverige gjennomfører de svenske nationella prov på svensk, og i Finland gjennomfører elevene ikke slike prøver i noen fag eller ferdigheter. For andre truede språk finnes det egne læreplaner og nasjonale prøver i literacy (tekstkompetanse) og numeracy (tallkompetanse) blant annet på walisisk, maori og hawaiisk. Disse språkene er imidlertid i en helt annen samfunnsmessig situasjon enn de samiske språkene, blant annet på grunn av antallet som snakker språket, og antallet elever som følger undervisningen og gjennomfører prøvene.

Henriksen mfl., (2018)

Eksamen er også en prøve som får mye oppmerksomhet både fra elevene og lærerne. Eksamen har en stor og framtredende plass i ungdomsskolen, på 10. trinn og i den videregående opplæringen. Forskere har vist at lærere tilpasser undervisning etter eksamen, i tillegg til å bruke læreplanverket (Mølstad mfl., 2021). Innspill fra Lektorlagets fagutvalg i kjemi peker på at eksamen representerer en konkretisering av læreplanen. Fagutvalget beskriver det som en styrke at den bidrar til en slags felles tolkning av læreplanen.

Eksamensgruppas kunnskapsgrunnlag (2019) viser til ulike studier som dokumenterer at forholdet mellom eksamens- og standpunktkarakterer er uklart for mange lærere og skoleledere (Hovdhaugen mfl., 2018; Hovdhaugen mfl., 2014). Det er blant annet ulik oppfatning av om eller i hvilken grad de to karakterene bør harmonere, og om eksamen representerer en smalere prøving av kompetanse enn standpunktvurderingen. Ulik forståelse av hva som er eksamens rolle kan for eksempel gi grunnlag for ulike tolkninger og bruk av karakterstatistikk i lokale kvalitetsvurderingssystemer. Dette kan få kan få konsekvenser for det lokale utviklingsarbeidet.

Måling av ferdigheter og fag gjennom enkelte prøver kan på en annen side føre til uønsket forskyvning av hvilke mål som blir sett på som de viktigste i opplæringen (Frønes mfl., 2012). En innvending mot dagens kvalitetsvurderingssystem har vært at systemet i for stor grad legger vekt på tall og målinger innenfor enkelte områder og i for liten grad kvalitativ og kontekstuell informasjon (Mausethagen mfl. 2018b).

Spesielt har denne kritikken vært knyttet til de nasjonale prøvene. Kritikken handler om at målingen av elevenes ferdigheter er frakoblet viktig kontekstuell informasjon om elevene og læringen og utviklingen deres. Prøvenes innhold kan lett få for stor betydning, noe som kan føre til ensidig vektlegging i strid med helheten i læreplanverket (Lie, 2012). Det finnes blant annet eksempler på at kommunale skoleeiere setter som mål at elevene i kommunen skal prestere over landsgjennomsnittet på de nasjonale prøvene. Skolene får videre i oppdrag å arbeide for å forbedre resultatene, og undervisningen vil kunne bli dreid mot nettopp den typen ferdigheter eller kunnskaper prøvene måler (Frønes mfl., 2012).

Internasjonal forskning viser at skoler og skoleeiere kan legge uforholdsmessig mye vekt på indikatorer som de blir målt på (Meld. St. 21 (2016–2017)). Prøveresultater kan ha innvirkning på lærernes arbeid i klasserommet med tanke på metodevalg og hva slags kunnskap de legger vekt på (Werler og Færevaag, 2017). Dette har igjen ført til spørsmål om lærerne i mindre grad benytter seg av egen kunnskap, og om prøvene bidrar til å begrense lærernes handlingsrom (Stornes mfl., 2013). Kontroll av elevenes resultater bryter med hvordan skolen tradisjonelt har blitt styrt, og kan utfordre synet på undervisning og læring og synet på lærernes handlingsrom (Mausethagen, 2013c; Werler og Færevaag, 2017).

Lærere og skoleledere kan oppfatte at det er et press for å oppnå stadig bedre resultater på prøver i skolen (Eriksen mfl., 2017; Mausethagen mfl., 2018b).

I et innspill fra Elevorganisasjonens fylkeslag i Rogaland går det fram at hovedutfordringen ikke er det totale antallet prøver elevene skal ta, men at mange prøver er tett på hverandre i korte perioder.

13.3 Gir kvalitetsvurderingssystemet nok – og god nok – informasjon?

Fra kvalitetsvurderingssystemet får elevene, foreldrene, lærerne, skolelederne, skoleeierne og de nasjonale myndighetene tilgang på informasjon om elevenes læringsresultater, elevenes opplevelse av skole- og læringsmiljøet og annen informasjon fra statistikkilder som for eksempel Grunnskolens Informasjonssystem (GSI) og Utdanningsdirektoratets statistikk.no. Det varierer imidlertid hvor mye informasjon de enkelte aktørgruppene har tilgang på, noe som blant annet henger sammen med hvilken rolle man har i systemet. I tillegg til informasjon fra kvalitetsvurderingssystemet har aktørene tilgang til en rekke andre kunnskapskilder og støtteressurser som kan inngå som en del av grunnlaget for kvalitetsutviklingsarbeidet.

Gir systemet nok informasjon?

Forskere viser at kompetansen og profesjonaliteten rundt datainnsamling i det norske utdanningssystemet er betydelig styrket de siste tjue årene. Utfordringen nå er å fokusere på å tolke og bruke data og ikke nødvendigvis å innhente mer (Hopfenbeck, 2022).

Når det er mange ulike kunnskapskilder og støtteressurser tilgjengelig kan det være utfordrende å få oversikt over hvilken informasjon og hvilke kilder som er relevante, og hvordan nyttiggjøre seg av dem.

Prøvene og undersøkelsene har vært kritisert for at de gir lite informasjon utover det lærerne allerede vet fra før i kraft av å være tett på elevene. Dette synet kommer blant annet til uttrykk i en intervjuundersøkelse av Svanæs mfl. (2022). Lærerne ga inntrykk av at Elevundersøkelsen var verdifull for skolelederne og skoleeierne, men at lærerne ikke syntes den var spesielt relevant for dem. De mente at de allerede kjente elevene sine godt, og at de hadde oversikt over styrker og svakheter i sitt eget læringsmiljø.

Utdanningsforbundet viser i innspill at lærerne mener at mengden data og tall er overveldende samtidig som de bare viser et utsnitt av skolens virksomhet og oppdrag. Liknende synspunkter kom fram i den samme intervjuundersøkelsen gjort for utvalget. Skolelederne og skoleeierne ga i intervjuene uttrykk for at det ikke var behov for mer informasjon eller flere støtteverktøy, men at det i større grad var behov for å arbeide bedre med den informasjonen som i dag er tilgjengelig (Svanæs mfl., 2022).

Hva systemet ikke gir informasjon om

Prøvene i dagens system er i stor grad knyttet til målinger av enkelte ferdigheter og noen utvalgte fag på utvalgte trinn (se tabell 7.2). Det er i større grad målinger av elevenes lese- og regneferdigheter enn målinger av elevenes kompetanse i fag. Enkelte trinn har flere obligatoriske prøver og undersøkelser enn andre trinn. Det er blant annet tre nasjonale prøver på 5. trinn og tre nasjonale prøver på 8. trinn (se også oversikt i kapittel 7).

I den videregående opplæringen derimot er det ingen obligatoriske prøver i systemet i dag som kan gi informasjon om elevenes ferdigheter eller kompetanse i fag i systemet for disse trinnene utover informasjon fra standpunkt- og eksamenskarakterer. Norsk Lektorlag peker i innspill til utvalget på at det er få kilder til å vurdere kvalitet underveis i opplæringen i den videregående opplæringen og at informasjonen i overgangen mellom ungdomstrinnet og den videregående opplæringen er mangelfull.

Hensynet til elevenes personvern gir begrensninger

Behandling og utveksling av personopplysninger er en nødvendig forutsetning for et moderne og velfungerende samfunn. Behandling av personopplysninger kan likevel også true vernet av privatlivets fred, spesielt dersom opplysningene blir brukt utenfor formålet eller kommer på avveie.

Personopplysningsloven legger noen begrensninger når det gjelder hvilken informasjon skoler og skoleeiere kan få tilgang til fra prøver og undersøkelser i kvalitetsvurderingssystemet. Personopplysningsloven setter også begrensninger for hvilken informasjon som er offentlig tilgjengelig. Noe av dataene og informasjonen som er samlet inn gjennom kvalitetsvurderingssystemet får skoler, kommuner og fylkeskommuner tilgang til gjennom å logge seg inn i egne deler av for eksempel analysebrettet, GSI eller andre resultatportaler som viser dataene og informasjonen fra for eksempel prøver. I den åpne offentlige delen av systemene er flere av dataene skjermet på grunn av enkeltindividers personvernhensyn. Dette gjelder blant annet resultatene fra nasjonale prøver i lesing på samisk.

Av personvernhensyn gir Elevundersøkelsen bare informasjon på gruppenivå og ikke informasjon om hvordan enkeltelever opplever skole- og læringsmiljøet sitt. Flere av dataene fra Elevundersøkelsen blir også ofte skjermet på skole- og skoleeiernivået fordi resultatene fra undersøkelsen ikke skal inneholde direkte identifiserbare personopplysninger, jf. forskrift til opplæringsloven § 2-3 og forskrift til privatskoleloven § 2-3. Dette gjør at mindre skoler og kommuner oftere får utfordringer med å få tilgang til informasjonen fra systemet enn det større skoler og kommuner gjør. Flere av innspillene utvalget har mottatt peker på dette som en utfordring. Som en konsekvens av at de mangler tilgang til tilgjengelig informasjon, benytter flere skoler og kommuner ikke-anonyme læringsmiljøundersøkelser som en del av skolemiljøarbeidet sitt (Caspersen mfl., 2017). Bruken av denne typen undersøkelser har reist flere problemstillinger ettersom de utgjør en risiko for personvernet til elevene (Prop. 145 L (2020–2021)).

Hvor gyldig og pålitelig er informasjonen fra prøver og undersøkelser?

For alle informasjonskilder må det tas høyde for at dataene er forbundet med en viss grad av usikkerhet. Ett av forholdene som påvirker usikkerheten er antallet som gjennomfører en prøve eller undersøkelse. For små skoler og kommuner er det en utfordring at gjennomsnittsverdier er mer påvirket av ulike feilkilder (Hovdhaugen mfl., 2017; Seland mfl., 2013). For de minste enhetene vil spesielt utviklingen over tid være ustabil og vanskelig å tolke (Bjórnsson, 2022).

Utformingen av selve prøven eller undersøkelsen er et annet forhold som påvirker hvor pålitelig informasjonen fra prøvene eller undersøkelsene blir. Nasjonale prøver har høy gyldighet og pålitelighet, noe som betyr at prøvene måler det de er ment å måle. Samtidig er innholdet i prøven utviklet slik at prøven gir mest treffsikker informasjon om «gjennomsnittseleven». Det betyr at det er flest oppgaver som er middels vanskelige som mange elever klarer. Dermed er det færre av de aller enkleste og aller vanskeligste oppgavene, noe som igjen gjør at informasjonen fra prøven om elever som presterer høyt eller lavt på skalaen er mer usikker. Sammenliknet med de internasjonale undersøkelsene er bredden i målingen til nasjonale prøver ganske liten. Dette er en nødvendig konsekvens av å måle alle elevene med nøyaktig den samme prøven med de samme oppgavene (Bjórnsson, 2022).

Elever med vedtak om spesialundervisning og vedtak om særskilt språkopplæring har rett til fritak fra nasjonale prøver og kartleggingsprøver. Det er også egne regler for hvilke elever som ikke skal delta på de internasjonale undersøkelsene. Elevene har også rett til ulike former for tilrettelegging av blant annet prøver, undersøkelser og eksamen når de har behov for det. Manglende tilrettelegging av eksisterende prøver og undersøkelser i dag eller at det ikke er utviklet prøver og undersøkelser som egner seg for å vise ferdigheter og kompetanse til for eksempel elever som ikke skal ta nasjonale prøver, forårsaker skjevheter og gjør at ikke hele elevpopulasjonen er representert i dataene.

Statped peker i sitt innspill til utvalget på at eksempelvis blinde og sterkt synshemmede elever opplever å få prøver og undersøkelser som riktignok oppfyller kravene til universell utforming, men der innholdet ikke har blitt synstolket (oversatt) på en god nok måte.

Andre innspill til utvalget peker i retning av at det er behov for å se på hvordan systemet er utformet med tanke på å inkludere alle elever og kunne gi et bedre sammenlikningsgrunnlag. Dette er eksempler på at informasjonen fra dagens system samlet sett ikke fullt ut kan sies å representere alle elever. Det betyr ikke at datakildene i seg selv ikke er gyldige eller pålitelige, men at de kan inneholde skjevheter som det er viktig å være kjent med.

En undersøkelse av testmotivasjonen til elever i PISA-undersøkelsen viste at elevene rapporterer at de generelt er motiverte til å yte sitt beste på standardiserte prøver og undersøkelser selv om disse ikke er en del av elevenes vurderingsgrunnlag (Hopfenbeck og Kjærnsli, 2016).

Samtidig peker innspill Utdanningsforbundet har samlet inn fra lærere i videregående skoler på at lærerne noen ganger opplever en viss trøtthet hos elevene dersom elevene må svare på flere ulike undersøkelser innenfor et relativt kort tidsrom. Utvalget har også fått flere innspill om at Elevundersøkelsen blir oppfattet som for lang, og at språket i undersøkelsen er for lite tilpasset elevene. Dette kan igjen føre til at elevene misforstår eller mister motivasjonen for å svare underveis i undersøkelsen, noe som kan påvirke hvor gyldig og pålitelig resultatene fra undersøkelsen er.

Hva kan offentliggjøring føre til?

Et viktig prinsipp da kvalitetsvurderingssystemet ble innført var å synliggjøre skolens resultater og skape åpenhet og diskusjon rundt skolens virksomhet. Et poeng for offentliggjøringen var at skolen og skoleeierne skulle gjøres ansvarlige for elevenes og skolens oppnådde resultater (Hopfenbeck, 2014). Informasjonen skulle samtidig ikke komme i konflikt med elevenes personvern eller føre til at enkeltelever kunne bli identifisert (St.prp. nr. 1 Tillegg nr. 3 (2002–2003)). I dag er resultater fra kvalitetsvurderingssystemet gjort tilgjengelig for allmenheten, blant annet i form av statistikk på Utdanningsdirektoratets nettsider.

Allerede fra start ble utfordringer knyttet til offentliggjøring av resultater debattert. Det ble blant annet diskutert at åpen publisering kunne føre til feiltolkninger eller uheldig bruk av resultatene, for eksempel i form av rangeringer i media (Elstad, 2009). Bekymringer knyttet til om personvernet ble ivaretatt ble også løftet fram (St.prp. nr. 1 Tillegg nr. 3 (2002–2003)).

OECD pekte i 2011 på at det fremdeles var uenighet om i hvilken grad det skulle være åpenhet om resultatene, og på hvilke nivåer nasjonale myndigheter skulle publisere resultatene. Dette gjaldt spesielt resultatene fra nasjonale prøver (Nusche mfl., 2011).

Media spiller en betydningsfull rolle i framstillingen og forståelsen av standardiserte prøver (Hargreaves og Shirley, 2009). Et eksempel på dette er blant annet hvordan offentliggjøringen av resultatene fra de første nasjonale prøvene ledet til en boikott av prøvene i den videregående opplæringen. I de første årene med nasjonale prøver ble ikke resultatene publisert på skolenivået på Skoleporten.no. I stedet ble skoleresultater utlevert til dem som ba spesielt om innsyn i tråd med offentlighetsloven (Utdanningsdirektoratet 2020d). Resultatet ble rangeringer og sammenstillinger utformet av, og presentert i media som i liten grad bidro til en god dialog om kvalitet i skolen. Senere har Utdanningsdirektoratet vurdert at det er bedre med offentliggjøring i deres kvalitetssikrede statistikkverktøy.

Den offentlige debatten om nasjonale prøver har endret seg det siste årene. Medieoppslagene i de første årene etter innføring av nasjonale prøver var preget av at både nasjonale og lokale medier publiserte rangeringstabeller. Oppslagene de siste årene har dreid mer i retning av at lokale medier diskuterer skolekvalitet på bakgrunn av resultater fra nasjonale prøver (Utdanningsdirektoratet, 2020d). Dette kan tyde på at det har blitt en større aksept for at elevene skal gjennomføre prøvene (Mausethagen mfl., 2018b; Vestheim og Sem, 2019).

Resultatene fra nasjonale prøver står i et spenningsforhold til lærergjerningen og profesjonsverdiene om å se hele eleven (Mausethagen mfl., 2018b). Forskerne bemerker at lærerne følger elevene fra dag til dag og vil være opptatt av å vurdere den enkelte elevs utvikling ut fra forutsetningene deres. I en slik situasjon kan lærerne oppleve det som en utfordring at framstillingen av testresultatene i for liten grad synliggjør lærernes innsats og elevenes individuelle framgang. Innspill fra fylkeslagene i Utdanningsforbundet peker på at mengden data og tall blir overveldende, samtidig som de mener at det viser bare et utsnitt av en skoles virksomhet og oppdrag. De opplever utfordringer rundt rangering og bruk av denne informasjonen som et kvalitetsstempel. De mener dette hemmer profesjonens mulighet til å vurdere dette profesjonsfaglig, fordi det har store mangler i forhold til skolens brede mandat.

Problematikken om rangering er også til stede for de internasjonale undersøkelsene. OECD, som står bak PISA-undersøkelsen, rangerer deltakerlandene etter ulike utfallsmål i sine presentasjoner av resultatene. En rekke studier viser at resultater fra PISA benyttes politisk, og at bruken ofte er basert på feiltolkninger og misforståelser fordi det ikke blir tatt høyde for usikkerheten i tallene (Sellar mfl., 2017). I rapportene som norske forskningsmiljøer har utarbeidet på bakgrunn av data fra de internasjonale undersøkelsene, har det imidlertid i liten grad vært lagt vekt på rangering (Bjórnsson og Olsen, 2018; Frønes mfl., 2020).

Utvalget merker seg at det årlig blir publisert statistikk over standpunkt- og eksamenskarakterer. Disse publiseringene får også oppmerksomhet i media, men utvalgets erfaring er at disse sjeldent brukes til å rangere skoler, kommuner eller fylkeskommuner.

13.4 Er forutsetningene for god bruk av kvalitetsvurderingssystemet til stede?

Ulik kompetanse og kapasitet

Skolens organisatoriske forutsetninger er avgjørende for hvorvidt kvalitetsvurderingssystemer har innvirkning (Elstad mfl., 2008; Roald, 2010). Kravene i lovverket og forventningene til at skolen og skoleeierne skal følge opp og analysere resultatene, er de samme uavhengig av størrelsen på skolene eller skoleeierne.

Det synes å være en sterk positiv sammenheng mellom kommunenes kapasitet til å støtte skolene og en konstruktiv bruk av resultater fra det nasjonale kvalitetsvurderingssystemet på skolenivå (Allerup mfl., 2009) Forskning på bruk av elevresultater viser liknende variasjon i lokale kvalitetsvurderingssystemer sett i lys av kommunens størrelse og organisering (Mausethagen mfl., 2018b).

Forskjeller mellom kommunene og fylkeskommunene gir blant annet utslag i størrelsen på skoleeieradministrasjonen, skoleledelsen og profesjonsfellesskapet. OECD konkluderte i gjennomgangen av kvalitetsvurderingssystemet i 2011 blant annet med at det ikke var realistisk å forvente at små skoleeiere skulle ha lik kapasitet som større skoleeiere til å utvikle et system for skolevurdering og forbedring (Nusche mfl., 2011).

På den annen side kan det også være noen fordeler knyttet til å være en liten kommune. Det kan for eksempel være mer oversiktlig og dermed enklere å tilrettelegge for en tett dialog mellom aktørnivåene.

Helt siden kvalitetsvurderingssystemet ble innført har systemets viktigste funksjon vært å legge et grunnlag for lokalt utviklingsarbeid. Samtidig har det vært en økende erkjennelse av at kompetansen og kapasiteten til å dra nytte av kvalitetsvurderingssystemet, i varierende grad er til stede (Ekspertgruppe for skolebidrag, 2020).

Ut fra måten utdanningspolitiske dokumenter omtaler kvalitetsvurdering på kan det se ut som at nasjonale myndigheter tar for gitt at lærerne, skolelederne og skoleeierne automatisk vet hva de skal gjøre for å forbedre de pedagogiske prosessene når de får informasjon om elevenes resultater (Mausethagen mfl., 2018b). Forskerne påpeker at selv om det er en forventning til skolene om at de skal bruke resultater for å videreutvikle undervisningen og elevenes læring, betyr ikke det at alle lærere, skoleledere og skoleeiere har kunnskapen de trenger for å tolke dataene og omsette dem i pedagogisk praksis og bruke dette til forbedrings- og utviklingsprosesser. Selv om lærerne har tilgang til et bredt spekter av data, viser forskning at det er utfordrende å bruke informasjonen på en måte som fører til grunnleggende endringer i undervisningen og økt læring for elevene (Mandinach og Schildkamp, 2021).

Utfordringer i arbeidet med kvalitetsutvikling handler om flere forhold. Blant annet kan det være ulik forståelse av formålet med kvalitetsvurderingen, manglende kompetanse i å tolke tall og statistikk og generelt vanskelig å omsette tall til tiltak for kvalitetsutvikling (Ekspertgruppe for skolebidrag, 2021).

Behov for tid til oppfølgning

Studier har vist at lærerne var bekymret for at det ikke var satt av tid til å følge opp resultatene fra de nasjonale prøvene, og at dette arbeidet ville kunne gå utover andre oppgaver. At det mangler tid til oppfølgning, kan føre til at skoler får begrenset utbytte av resultatene (Gunnulfsen og Roe, 2019). Studier viser at rundt halvparten av grunnskolene pålegger lærerne å skriftliggjøre oppfølgingspunkter etter at de nasjonale prøvene er gjennomført (Grindheim mfl., 2014). I dag har lærere mye informasjon og data til å identifisere elever med utfordringer, men ikke nødvendigvis tid, ressurser eller kompetanse til å følge det opp. Dette blir et verdidilemma for lærerne som opplever å ikke få gjort nok for elever som strever eller ikke har kommet i mål (Mausethagen mfl., 2018b; Mausethagen mfl., 2020).

Utdanningsforbundets lederråd peker på at de opplever at det totale omfanget av kommunale, nasjonale og internasjonale datainnsamlinger med formål om styring tar såpass mye tid at lærerne ikke rekker å sette seg inn i dataene eller å samle inn informasjonen de trenger i det daglige faglig-pedagogiske arbeidet.

I Utdanningsforbundets innspillsrunde kom det også fram synspunkter fra lærere på ungdomsskoler om at de nasjonale prøvene har blitt et bedre verktøy for læreren, og at det er nyttig å se utviklingen til elevene fra 8. til 9. trinn. De viser til at de nasjonale prøvene er et viktig verktøy som har blitt mindre tidkrevende for lærerne. I samme innspillsrunde pekte lærere fra grunnskolen på at nasjonale prøver er en tidstyv, og at lærerne opplever å bruke mye tid på prøvene sett opp mot det lærerne mener er manglende utbytte av prøvene. Innspillene sier også at prøvene burde hatt en tettere kopling til fagene, eventuelt flere ferdigheter og den nye læreplanen.

En forutsetning for bruk av informasjonen fra kvalitetsvurderingssystemet til kvalitetsutvikling i skolen er at de ansatte i skolen har formell kompetanse som trengs til å endre og forbedre egen undervisning- og vurderingspraksis i fag. I den forbindelse er det en utfordring at det fortsatter mange lærere som ikke har godkjent utdanning og som ikke oppfyller kompetansekravene for å bli tilsatt og for å undervise, både i grunnskolen og i den videregående opplæringen (NOU 2022: 13).

Videre er det avgjørende at lærerutdanningene utvikler studentenes kompetanse til å analysere og tolke dataene. Noen av innspillene utvalget har fått fra flere av miljøene som utvikler prøver, påpeker at det også er et behov for å se på hvordan lærerutdanningene gir studentene kompetansen de trenger for å bruke informasjonen som prøvene gir om elevene. I innspill til utvalget viser en av lærerutdanningene til at det allerede er presisert i rammeplanene at kandidatene skal lære å bidra til å vurdere tilstanden og utvikle kvalitet i skolen. De anerkjenner samtidig at analysekompetanse er vesentlig å utvikle.

Samarbeid og felles forståelse i kvalitetsutviklingsarbeidet

Det er tidligere i innstillingen vist til at høy grad av medvirkning fra elever, lærere, skoleledere og skoleeiere kjennetegner de skolene med høyt bidrag til elevenes læring (Ekspertgruppen for skolebidrag, 2021). Forskning peker også på at det er viktig å fokusere på hvordan data brukes og forstås for å forbedre lærernes praksis, samtidig som det krever at informasjonen er tilgjengelig i et språk som alle brukerne forstår (Hopfenbeck, 2022).

Dette gjelder også for involvering av elever. Norske elever har rett til å medvirke i eget læringsarbeid og til å bli involvert i kvalitetsutviklingsarbeidet. Involveringen av barn og unge skal skje i tråd med alder og modenhet. Elevmedvirkning i Norge viser seg blant annet gjennom at skoler aktivt støtter elevenes mulighet til å ha elevråd, at elevene er vant til å bli hørt i undervisningen, og at stemmene deres vektlegges i læringsarbeidet (Hopfenbeck, 2022). I et innspill fra Elevorganisasjonens sentralstyre til utvalget understreker de at elevene trenger å kjenne hvilke valg, rettigheter og tilbud de har, og at de må være informert om elevrådet og hvordan de kan påvirke egen skolehverdag.

Tillit til lærernes vurdering

Enkelte studier viser at der det er tillit mellom lærerne og skolelederne erfarer elevene en praksis som er i tråd med intensjonene i kvalitetsvurderingssystemet (Hopfenbeck mfl., 2015).

Norske elever i grunnopplæringen blir i all hovedsak vurdert av lærerne sine. Elevene har sin første eksternt vurderte eksamen når de avslutter grunnskolen på 10. trinn. Da gjennomfører elevene én sentralt gitt skriftlig eksamen og én lokalt gitt muntlig eller muntlig-praktisk eksamen. I andre nordiske land utgjør også lærernes vurdering av elevenes kompetanse en vesentlig del av sluttvurderingene, men på ulike måter (Hovdhaugen mfl., 2022a). Tilliten lærerne har i Norge og i Norden til å sette standpunktkarakterer i alle fag er unik sammenliknet med mange andre land. I England, for eksempel, får elevene eksternt gitt karakterer i alle fag basert på karakterer fra avsluttende eksamener eller tester ved endt skolegang (Hopfenbeck, 2022).

Smitteverntiltak som følge av korona-pandemien førte til at eksamen ble avlyst våren 2020, våren 2021 og våren 2022 (Prop. 1 S (2022–2023)). I disse årene fikk elevene bare standpunktkarakterer satt av lærerne som sluttvurdering. Lærerne opplevde at det i hovedsak gikk greit å vurdere elevene, men at de måtte ta i bruk nye vurderingsformer. Det var en felles forståelse i skolene om at korona-pandemien og tiltakene i minst mulig grad skulle gå ut over elevenes mulighet til å gjennomføre opplæringen (Andersen mfl., 2021). Studier om elevmedvirkning i vurdering under pandemien viste likevel at mange elever opplevde at de fikk lite støtte fra læreren i læringsprosessen, de jobbet alene og følte seg usikre på hva som var utgangspunkt for sluttvurderingen i fagene (Sandvik mfl., 2022).

Forskere har pekt på at en utfordring med standpunktvurderingen er at det finnes begrenset med nyere forskningsbasert kunnskap om lærernes praksis rundt standpunktvurdering i Norge (Skar og Hopfenbeck, 2021).

Innspill som Utdanningsforbundet har hentet inn til utvalget fra videregående skoler, peker på at det er det en styrke å ha eksamen. De legger vekt på at et viktig aspekt ved eksamen handler om å kvalitetssikre og kalibrere blant annet måten å vurdere på i fag, på tvers av fylker og på tvers av fagmiljøer på den enkelte skole. Inntrykket deres er at sensorskoleringen til sentralt gitt skriftlig eksamen i den videregående opplæringen er svært god og enhetlig, og at dette er kompetanse og erfaringer hver enkelt sensor tar med seg tilbake til skolen sin og fagmiljøet sitt.

13.5 Utvalgets oppsummering og vurdering

I dag har elevene, lærerne, foreldrene, skolelederne, skoleeierne, de nasjonale myndighetene forskere og offentligheten flere felles kilder til kunnskap om skolen og elevenes læring og trivsel enn før kvalitetsvurderingssystemet ble innført. Gjennom informasjon fra prøver, verktøy og datakilder får alle aktørnivåene i sektoren kvalitetssikret informasjon på noen områder, selv om den har varierende relevans og nytte for ulike aktører. Utvalget mener det er en styrke ved dagens system at det har bidratt til å etablere et felles kunnskapsgrunnlag om skolen. Det er viktig å bygge videre på det som fungerer bra i dag.

Utvalget mener at det ved alle systemer for kvalitetsutvikling må gjøres valg og prioriteringer blant annet med hensyn til omfanget av systemet, hvor bredt det skal favne, hvilke sider ved opplæringen det skal gi informasjon om og hvilke aktører som skal bruke informasjonen. Ingen systemer kan måle hele bredden i utdanningen, eller være like godt tilpasset behovene til alle aktører. I det norske kvalitetsvurderingssystemet er det gjort konkrete valg og prioriteringer som gjør at systemet gir mer informasjon om visse sider ved utdanningen enn andre, og som gjør at systemet er best tilpasset noen aktørers behov. Disse valgene og prioriteringene vil være gjenstand for diskusjon og analyse i utvalgets videre arbeid.

Utvalget ser i gjennomgangen av kvalitetsvurderingssystemet at formålet i varierende grad blir oppfylt for ulike aktørgrupper. Det er ulike perspektiver blant aktørene og innad i aktørgruppene når det gjelder hva de vurderer som nyttig informasjon for kvalitetsutvikling i lys av sine roller og ansvar. Der noen aktører peker på at systemet gir informasjon om sentrale og viktige deler av det skolen skal bidra til, sier andre aktører at systemet ikke ivaretar skolens brede mandat og bredden av fag. Utvalget ser at dette kan bidra til målforskyvning i den forstand at skolene vier mest oppmerksomhet til ferdighetene og kompetansene som systemet måler og at skolens brede mandat for både danning og utdanning ikke verdsettes i tilstrekkelig grad.

Generelt ser utvalget at skolelederne, skoleeierne og de nasjonale myndighetene mener at informasjonen fra kvalitetsvurderingssystemet er nyttig for å ivareta eget ansvar i kvalitetsutviklingsarbeidet. Blant lærerne er det større variasjon i hvor nyttig de opplever informasjon fra systemet. Dette kan knyttes til at systemet skal fungere for både kvalitetsutvikling og styring. For utvalget framstår det som en utfordring at aktørene som er involvert direkte i arbeidet med faglig og pedagogisk utvikling, i mindre grad opplever at systemet gir god støtte til dette. Utvalget vil i det videre arbeidet legge til grunn at systemet må gi nyttig informasjon til kvalitetsutviklingsarbeidet til alle aktørene. Dette gjelder både systemet som helhet og de ulike prøvene, verktøyene og datakildene.

Utvalget ser at systemet ikke gir like god informasjon om samiske elever. Dette er blant annet knyttet til at ikke alle undersøkelser og verktøy er tilgjengelig på alle tre samiske språk, og at det er begrensninger i hvilken informasjon systemet kan gi om elever som har opplæring i og på samisk på grunn av personvernhensyn. Utvalget mener det er viktig å sørge for at innholdet i systemet også kan bidra til et kvalitetsutviklingsarbeid som er tilpasset elever som har opplæring i og på samisk.

Systemet har vært kritisert for å ikke ha en tydelig avgrensning og for å mangle helhet og sammenheng. Utvalgets gjennomgang av systemet bekrefter at det er ikke en tydelig grense for hva som inngår i kvalitetsvurderingssystemet, eller om det er et eget system. Utvalget ser at nasjonale myndigheters forventninger til å inkludere et lokalt kunnskapsgrunnlag i kvalitetsvurderingsarbeidet kan bidra til uklarhet om hva som utgjør skolens informasjonsgrunnlag. Utvalget vil i det videre arbeidet undersøke om, og eventuelt hvordan helhet og sammenheng i kvalitetsutviklingsarbeid kan videreutvikles, og hvordan lokal kunnskap bør inngå i dette.

Personvernhensyn legger begrensninger på hvilken informasjon skolene og skoleeierne kan få tilgang til. Dette fører til at små skoler og kommuner oftere får utfordringer med å få tilgang til informasjonen fra systemet enn det større skoler og kommuner gjør. Utvalget mener det er viktig og nødvendig å ivareta elevenes personvern, og mener det bør undersøkes hvordan personvern kan ivaretas samtidig som alle med et legitimt behov for informasjon får tilstrekkelig tilgang.

Utvalget vurderer at tid, kapasitet og kompetanse er sentrale forutsetninger for å tolke og bruke informasjonen fra dagens system. Kravene i lovverket og forventningene til skolene og skoleeierne om å følge opp og analysere resultatene er de samme, uavhengig av variasjoner i antall elever og ansatte på skoler og hos skoleeierne. Utvalget mener at dagens system ikke i tilstrekkelig grad ivaretar skolers og kommuners ulike behov for kvalitetsutvikling.

Dagens system gir i hovedsak kvantitative data, og i mindre grad kvalitativ informasjon. Utvalget vurderer at det er behov for å utvikle flere kvalitative kilder som kan støtte arbeidet med å utvikle kvalitet i skolen. Videreutvikling av koblingen mellom kvantitative og kvalitative data er mer i tråd med ulike aktørers behov, og vil i større grad kunne støtte faglig og pedagogisk kvalitetsutvikling i skolen.

Fotnoter

1.

www.udir.no/kvalitet-og-kompetanse/

Til forsiden