Mathilde Bjørnset, Aina Fossum, Jon Rogstad og Bjørn Smestad

På like vilkår?

Evaluering av matematikkeksamen på 10. trinn 2017-2019. Sluttrapport

Fafo-rapport 2020:01

Fafo-rapport 2020:01

Er eksamen i matematikk på 10. trinn rettferdig? I denne sluttrapporten belyses spørsmålet fra ulike vinkler. Vi ser på vanskelighetsgrad, bruk av tekstoppgaver, illustrasjoner og oppgavenes struktur, men også utfordringer i sensorenes arbeid.

Prosjektet har vært treårig. For hvert av årene har vi tatt opp et tema særskilt: Betydningen av språk, erfaringer med bruk av digitale hjelpemidler og i år hvorvidt elever på ulike mestringsnivåer har like muligheter til å få vist fram sin kompetanse på eksamensdagen.

About the publication

Temaet for rapporten er eksamenen i matematikk på 10. trinn i perioden 2017-2019. Rapporten er den siste av tre rapporter. Hver av rapportene har sett på det aktuelle årets eksamenssett. I tillegg har vi hvert år prioritert å løfte fram et tema særskilt. I den første rapporten (Andresen et al. 2017) så vi spesielt på betydningen av språk- og begrepsbruken i eksamensoppgavene, mens vi i fjorårets rapport (Bjørnset et al. 2018) analyserte betydningen av at eksamen legger stor vekt på kandidatenes digitale ferdigheter. Tema for årets rapport er å gi en helhetlig vurdering av matematikkeksamen som er gitt i perioden. I tillegg har vi et særlig fokus på de svakest presterende elevene, i betydningen av at de har karakteren 1 og 2 til standpunkt, elever som har blant de 10-30 prosent svakeste poengskårene på eksamen, samt minoritetsspråklige elever og elever med lese- og skrivevansker.

Felles for alle rapportene er spørsmålet om eksamen både er og oppleves å være rettferdig slik at kandidatene vurderes på like vilkår. Prosjektet skal besvare ni spørsmål.

1) Er det god sammenheng mellom eksamen læreplan og opplæringen som er gitt?

2) I hvilken grad er det samsvar mellom ulike sensorers vurdering?

3) Inneholder eksamen oppgaver av ulik vanskegrad, som kan måle alle kompetansenivåer?

4) Hvordan vurderer elevene eksamens arbeidsmengde i forhold til den tiden de har fått til rådighet totalt og på del 1 og del 2 av prøven?

5) Er eksamensoppgaven utformet slik at det er elevens matematikkompetanse som vurderes?

6) Vurdering av utviklingen for eksamen og sensuren i de tre årene

7) Er eksamensoppgaven utformet på en forståelig med hensyn til tekst og illustrasjoner?

8) Hva slags undervisning har elevene fått i bruk av digitale hjelpemidler og hvordan har de vært forberedt å bruke digitale hjelpemidler på eksamen?

9) Hvordan fungerer eksamen for elevene som presterer svakest?

Datainnsamlingen for undersøkelsen har vært sammensatt. Vi har sendt ut et elektronisk spørreskjema til matematikklærere på 10. trinn som har hatt elever oppe til eksamen. I tillegg har vi gjennomført kvalitative intervjuer med lærere og elever ved fire skoler, samt gjennomført klasseromsobservasjoner. Dessuten har vi lagt til spørsmål i Utdanningsdirektoratets spørreundersøkelse til sensorene og analysert eksamensbesvarelser.

Nedenfor følger noen sentrale konklusjoner fra årets rapport og fra prosjektet.

En god og rettferdig eksamen

Den sentrale konklusjonen i rapporten er at eksamen i all hovedsak framstår som rettferdig og med høy kvalitet alle tre årene. I dette ligger det at de ulike oppgavene i eksamenssettene har vært nært knyttet til undervisningen som elevene har fått og kompetansemålene som er nedfelt. Eksamen i matematikk har høy legitimitet blant elever og lærere. Mer konkret er nesten alle deler av læreplanen gjort til gjenstand for prøve i årene vi har studert. Denne konklusjonen samsvarer også med lærernes egne vurderinger, mens det er en økende andel av sensorene som mener at det er deler av læreplanen som aldri blir testet på eksamen.

Elever og lærere opplever også i hovedsak at innholdet på eksamen er i tråd med opplæringen som er gitt. Vi ser at eksamen i stor grad ligger tett på innholdet i lærebøkene elevene har, og det er ingen systematiske forskjeller mellom ulike læreverk. Da vi gikk inn på digitale verktøy spesielt, så vi imidlertid at elevene er gitt ulik opplæring i bruk av disse. Spesielt er det få som har fått opplæring i CAS[1]. Dette gir kandidatene systematisk forskjellige muligheter til å nyttiggjøre seg digitale hjelpemidler på eksamensdagen. Det er nærliggende å konkludere med at denne typen forskjeller utfordrer idealet om at i en eksamen skal kandidatene ha like vilkår til å besvare oppgavene de er gitt til eksamen.

Det dominerende bildet om at eksamen har holdt god kvalitet, styrkes også av analysene av vanskegrad og arbeidsmengde som er gjort på grunnlag av vurderingsskjemaene. I all hovedsak var vanskegraden tilstrekkelig variert til at elever på alle prestasjonsnivåer fikk mulighet til å få vist sin kompetanse – med unntak av de elevene som presterer svakest, som vi kommer tilbake til. Våre analyser viser også at det er forholdsvis få elever som opplever å ha fått for lite tid, og det er få tegn til at elevene systematisk ikke rekker de siste oppgavene på eksamen.

Når det gjelder språk og bruk av illustrasjoner, er hovedbekymringen at det store flertallet av oppgaver stiller språklige krav. Selv om lesing er en grunnleggende ferdighet også i matematikk, er det ikke nødvendig å teste denne ferdigheten i nesten alle oppgavene til eksamen. Vi har analysert ut fra en rekke språklige trekk som vi vet kan føre til at oppgaver blir vanskeligere for elever med svake leseferdigheter, og anbefaler å jobbe videre med å redusere forekomsten av flere av disse.

Kjennskap til en del av begrepene er knyttet til forhold som ikke er knyttet til matematisk kompetanse, men som i større grad vil variere med om man er født utenfor Norge og elevenes sosiokulturelle og sosioøkonomiske bakgrunn. Dette vil da kunne påvirke om eksamen er rettferdig. Det avgjørende hensynet i vurdering av rettferdighet er hvorvidt kandidatene har like vilkår til å prestere og om det er likhet i vurderingene som gjøres. Gitt at vi har konkludert med at eksamen gjennomgående har vært god i prosjektperioden, så har vi også i all hovedsak konkludert med at den er rettferdig. Men den språklige kompleksiteten i en del oppgaver, aktualiserer spørsmålet om noen elevgrupper rammes urimelig.

For at eksamen skal være rettferdig er det også en forutsetning at bokmål- og nynorskelevene får oppgaver som stiller de samme kravene. Hvert år har det vært svakheter i oversettelsene som har gjort at det på enkeltoppgavenivå kan stilles spørsmål ved dette, men for eksamenssettene under ett er det ingen systematisk skjevhet mellom bokmål- og nynorskelever.

Sensorenes vurderinger

En økende andel av sensorene forteller at de ikke opplever utfordringer når det gjelder å sikre rettferdig sensur. Veiledningsdokumentene oppfattes av sensorene som bedre i år enn for tre år siden, men fortsatt er ønsket at forhåndssensurrapporten skal komme tidligere. Et moment i den sammenheng er også at digitale leveringer har økt i prosjektperioden.

Flere sensorer trekker fram at de elevene som presterer svakest, i liten grad får mulighet til å vise sin helhetlige kompetanse siden mange av oppgavene er flervalgsoppgaver og oppgaver der det bare skal oppgis et svar. Videre viste våre analyser av vurderingsskjemaer fra eksamen i 2017 at det var til dels stor ulikhet i vurderingen mellom sensorene på de oppgavene som krevde bruk av digitale hjelpemidler, oppgavene hvor elevene selv velger en hensiktsmessig metode og oppgaver som stiller høyere krav til kommunikasjon og begrunnelse.

Elevene som presterer svakest

I årets rapport har vi sett særskilt på elever som presterte svakt til eksamen. Spørsmålet var hvorvidt de hadde samme mulighet som andre til å vise fram kompetansen. Av den tiendedelen som presterte svakest var det gjennomgående slik at de fikk til svært få av oppgavene på del 2. Oppgavene de mestrer er i stor grad flervalgsoppgavene, og oppgaver på et nivå tilsvarende kompetansemålene på 4. og 7. trinn i grunnskolen. Ifølge vurderingsforskriften §3-3 (Forskrift til opplæringslova, 2006) skal karakteren settes på basis av kompetansemålene. Våre analyser tyder på at elevene i liten grad oppfyller kravene til karakteren 2 ifølge kjennetegn på måloppnåelse. Statistikken viser at mange av disse elevene får de poengene som skal til for å få karakteren 2 ifølge poenggrensene som er satt, og at de ender opp med karakteren 2.

På spørsmål til lærere ble det framhevet at oppgavene på årets oppgavesett ikke ble vurdert som veldig vanskelige. En gjennomgående oppfatning synes snarere å være at eksamen kunne vært noe vanskeligere.

Utviklingen i perioden 2017 – 2019

På bakgrunn av de dataene vi har samlet inn vil vi trekke fram noen utviklingstrekk gjennom denne treårsperioden. For det første har dette vært tre år som våre informanter gjennomgående har synes at eksamen har vært ganske god. I den sammenheng er det relevant å trekke fram at oppgavenes utforming og i en del tilfeller også selve spørsmålsformuleringen, kan minne om hverandre fra år til år. Dette er imidlertid ikke noen selvfølge. Flere av informantene har referert til eksamen i 2015, som et eksempel på en eksamen som ikke fungerte særlig godt.

På to områder har det skjedd betydelig endring i perioden: vektingen mellom del 1 og del 2 er sterkt endret, og andelen flervalgsoppgaver er økt radikalt. Når det gjelder den samlede vanskegraden på eksamensoppgavene, viser IRT-analysene i Bjørnsson (2020) at elevenes kompetanse er endret «svært lite» i treårsperioden 2017-2019 (ibid, s. 21) og samtidig at det er «meget små» endringer i oppgavenes vanskegrad (ibid, s. 15). Likevel har gjennomsnittskarakteren økt fra 3,4 til 3,6. Når vi husker at en økning på én tidel vil tilsi at hver tiende elev får én karakter høyere, må en økning på to tideler karakteriseres som en betydelig økning. IRT-analysene tar imidlertid ikke hensyn til vekting av oppgavene. Dette tyder på at de forbedrede eksamensresultatene i hovedsak skyldes endringen i vektingen mellom de ulike oppgavene. Når del 1 får større vekt og den vanskeligere del 2 får mindre vekt, påvirker det karakterene i positiv retning når ikke karaktergrensene endres. Det har blitt vesentlig enklere å få karakteren 2 på eksamen.

Gjennom treårsperioden har eksamens tilknytning til læreplanen og undervisningen holdt seg på et høyt nivå, arbeidsmengden på eksamenssettet har i liten grad endret seg gjennom årene og sensorene er fornøyd med bedring i sensorveiledningen.

Innenfor de rammene som er satt, har eksamensoppgavene for 2017-2019 i hovedsak vært gode og rettferdige, sett i lys av de rammene som LK06 setter. Fagfornyelsen har nye vektlegginger som vil sette krav til endringer også i eksamensform, men mange momenter fra dagens eksamensform og fra våre rapporter vil være relevante også i utformingen av framtidas eksamener.

[1] CAS – Computer Algebra System. For eksempel inneholder det mye brukte programmet GeoGebra en CAS-del.