Hur påverkas elever av en mer fingradig betygsskala?
Hur påverkas elever av en mer fingradig betygsskala? Den här artikeln sammanfattar en ny studie där vi undersöker effekten av en svensk reform som ökade antalet godkända betyg i grundskolan från tre till fem. Vi finner att elever som fick betyg enligt den mer fingradiga betygsskalan var mindre benägna att ta examen från gymnasiet, från högskoleförberedande gymnasieprogram samt gymnasieprogram med STEM (naturvetenskap, teknik, ingenjörskap och matematik) eller estetisk inriktning. Berörda studenter var också mindre benägna att påbörja kurser med STEM-inriktning på universitetet. Studien tyder på att de negativa utfallen beror på att mer informativa betyg leder till ett minskat självförtroende.
Att personer får feedback på sina prestationer är vanligt i många olika sammanhang, exempelvis på arbetsplatsen och i skolan. I skolan är det vanligt att elever får feedback i form av betyg, och en begränsad men växande forskningslitteratur undersöker om förekomsten av feedback påverkar elevers prestationer, med blandade resultat (Bandiera m fl 2015; Sjögren 2010). Trots den utbredda användningen av betyg i dagens skolor har vi begränsad kunskap om hur betygens fingradighet påverkar elevers prestationer.
En mer fingradig betygsskala ger en mer exakt, och därmed också en mer informativ, återkoppling till elever om deras prestationer. Det finns många anledningar till att en mer fingradig betygsskala kan ha betydelse för en individs utbildningsresultat. En mer fingradig betygsskala bör ge eleverna mer korrekt information om deras styrkor och svagheter och därmed hjälpa eleverna att hitta bättre matchningar inom utbildning och på arbetsmarknaden (Bobba och Frisancho 2019; Chevalier m fl 2009). Mer informativ återkoppling minskar också informationsfriktioner för föräldrar så att de kan göra mer lämpliga investeringar i sina barns humankapital (Cobb-Clark m fl 2021; Dizon-Ross 2019). Om människor har överdrivet självförtroende, som en utbredd forskningslitteratur pekar mot, kan en mer informativ betygsskala däremot leda till ett minskat självförtroende (Bobba and Frisancho 2020), lägre ansträngning (Fischer och Sliwka 2018; Kőszegi m fl 2022) och fler avhopp (Stinebrickner och Stinebrickner 2014).
Att studera effekten av en mer fingradig betygsskala är utmanande. Att jämföra skolsystem med olika typer av betygsskalor är inte informativt eftersom det finns en myriad av institutionella, kulturella och demografiska faktorer som påverkar elevers resultat och som skiljer sig mellan skolsystem.
2011 infördes en mer fingradig betygsskala i grundskolan i Sverige. I Sverige är det barnets födelseår som avgör när det börjar skolan, detta innebär att barn födda på eller strax efter den 1 januari 1997 blev betygssatta enligt den mer fingradiga betygsskalan medan de som föddes strax före årsskiftet inte blev det. Reformen kan därför ses som ett naturligt experiment vilket möjliggör för oss att identifiera hur mer informativa betyg i årskurs 8 och 9 påverkar långsiktiga utbildningsresultat.
Vi finner att den mer fingradiga betygsskalan hade negativa konsekvenser för elevers utbildningsresultat. Elever som betygsattes enligt den mer fingradiga betygsskalan var 3,3 procent mindre benägna att ta studenten från gymnasiet och 7,6 procent var mindre benägna att ta examen från ett högskoleförberedande gymnasiesprogram. Dessa elever var också 11,9 procent mindre benägna att ta studenten från ett STEM-program på gymnasiet. Även om vi inte hittar någon effekt på sannolikheten att påbörja universitetsstudier, så hittar vi att sannolikheten att påbörja ett STEM-program på universitetet minskar med 16,7 procent. Vi hittade inte mycket som tyder på olika effekter beroende på kön eller socioekonomisk bakgrund.
För att identifiera de mekanismer som driver våra resultat använder vi enkätdata från ett representativt urval av skolbarn från ett flertal länder. Vi finner att elever som betygssatts efter den mer fingradiga betygsskalan var mindre benägna att anse sig själva prestera bra eller mycket bra i skolan. Detta indikerar att dessa elever får ett minskat självförtroende när de exponeras för en mer informativ betygsåterkoppling, vilket i sin tur leder till minskad egenförmåga och sämre utbildningsresultat. De berörda eleverna blev också mer benägna att rapportera att de känner press från sitt skolarbete och att de upplever sömnsvårigheter.
- Bakgrund
2011 implementerades en ny läroplan i grundskolan ”Läroplan för grundskolan, förskoleklassen och fritidshemmet”. Som en del av den nya läroplanen implementerades en mer informativ betygsskala i grundskolan. Före reformen betygsattes eleverna efter en skala med tre godkända betyg, nämligen godkänt, väl godkänt eller mycket väl godkänt. Efter reformen betygsattes eleverna efter en A–F-skala med fem godkända betyg, dvs A–E. Förändringen av betygsskalan genomfördes läsåret 2011/12 och påverkade elever som gick i åttonde klass det läsåret medan eleverna som gick i nionde klass fortsatte att få betyg efter den gamla skalan under hela sitt sista läsår i grundskolan (SFS 2010). Eftersom elever delas in i skolkohorter baserat på födelseår fick elever födda 1996 och tidigare betyg enligt den gamla skalan, medan elever födda 1997 och senare fick bokstavsbetyg.
Den nya läroplanen var en omfattande reform av den svenska grundskolan som innebar införandet av nya kursplaner, en mer fingradig betygsskala och betyg från tidigare åldrar. Dessa distinkta komponenter i den nya läroplanen implementerades stegvis, vilket möjliggör för oss att isolera effekten av en mer informativ betygsättning.
Infasningen av den nya läroplanen påbörjades 2011. Först infördes de nya kursplanerna för alla elever i grundskolan under läsåret 2011/12, vilket motsvarar elever födda 1996 eller senare. Eftersom en del av vår jämförelsegrupp (dvs elever födda 1996) berördes av de nya kursplanerna kan vi testa om de nya kursplanerna hade en effekt på de utbildningsresultat vi granskar. Vi kan inte påvisa att de nya kursplanerna hade en effekt på dessa utfall.
I nästa skede introducerades den mer informativa betygsskalan, vilket är den som fortfarande används. Både den gamla och den nya skalan angav kunskapskrav för respektive betyg, ett för var och en av betygen i det gamla systemet och ett för var och en av betygen E, C och A i det nya systemet. Betygen D och B hade inga egna specifika kunskapskrav utan tilldelades elever vars prestationer låg mellan betygen E, C och A. Kravens formuleringar är likartade i både det nya och det gamla systemet, där godkänt motsvarar E, medan väl godkänt och mycket väl godkänt har liknande kunskapskrav som betygen C respektive A. Med den nya betygsskalan måste eleverna dock uppfylla alla individuella kunskapskrav för att nå en viss betygsnivå i ett givet ämne, medan det under den gamla betygsskalan gick att kompensera svagheter i vissa krav med styrkor i andra krav. Detta innebär att det är svårare att uppnå betyget A eller C med den nya skalan, jämfört med väl godkänd respektive mycket väl godkänd med den gamla skalan. Enligt Skolverket var dock kravet för godkänt oförändrat (Utbildningsdepartementet 2009).
Slutligen infördes betyg från en tidigare ålder läsåret 2012/13, då elever födda 1999 började få betyg fr o m årskurs sju och elever födda 2000 och framåt fick betyg fr o m årskurs sex. Elever födda dessa år ingår inte i vår studie.
- Data och empiriska metoder
Vi använder svenska registerdata över grundskolan, gymnasieskolan och högskolan.1 Våra empiriska analyser baseras på en omfattande data som täcker alla svenska invånare födda mellan 1991 och 1997. Vi kan följa dessa individer t o m 2017.
Vi använder en metod som är en form av brytpunktsanalys, och som är vanligt förekommande för att identifiera effekterna av utbildningsreformer som påverkar alla elever i en given årskull (t ex Bertrand m fl 2021).2
Elever i 1997 års årskull exponerades för mer informativa betyg medan elever i 1996 års årskull samt tidigare årskullar inte exponerades för dessa betyg. Det skulle dock inte räcka att jämföra hur elevernas resultat skiljer sig mellan dessa årskullar eftersom det finns många anledningar till att resultaten kan variera från år till år. Föräldrar kan planera sitt barns födsel till en specifik tidpunkt i enlighet med sina preferenser kring familjeplanering, föräldraledighet, inkomst etc. Som ett resultat av detta kommer de genomsnittliga barnen i 1996 och 1997 års födelsekohorter sannolikt att vara olika av många skäl som är korrelerade med införandet av den mer informativa betygsskalan. Eftersom mer informativa betyg infördes för hela årskullen har vi inte heller någon samtida opåverkad kontrollgrupp. Vi kringgår dessa problem genom att jämföra personer födda kring den 1 januari 1997. Eftersom deras föräldrar, av olika anledningar, planerat sitt barns födelse så att det ska infalla nära slutet av 1996 och början av 1997 är det troligt att föräldrarnas preferenser och barnens tidiga livsförhållanden är mycket lika. På grund av små skillnader i tidpunkten för barnets födelse ingår några av dessa barn i födelsekohorten 1996 och några i födelsekohorten 1997. En del av dessa barn var alltså så gott som slumpmässigt exponerade för mer informativa betyg medan andra barn inte var det.
Denna jämförelse är känd som en brytpunktanalys. Att applicera denna metod på det här fallet är dock problematisk på grund av att barn födda tidigt på kalenderåret generellt sätt presterar bättre jämfört med barn födda sent på året (Black m fl 2011; Fredriksson and Öckert 2014).[3] För att hantera detta utökar vi modellen till att inkludera flera tidigare årskullar och jämför diskontinuiteten i resultat för barn födda på vardera sidan av årsskiftet 1997, med samma diskontinuitet vid tidigare årsskiften.
Slutligen, även om tiden för skolstart i Sverige baseras på födelseår, är denna regel inte helt bindande. Vi använder därför födelsemånad som instrument.
- Resultat
Effekter på utbildningsresultat
Tabell 1 redogör för de estimerade effekterna av mer informativa betyg på utbildningsresultat. Sannolikheten att ta examen från gymnasieskolan minskar med 2,6 procentenheter, medan sannolikheten att ta examen från ett högskoleförberedande gymnasieprogram minskar med 3,5 procentenheter som ett resultat av mer informativ betygsättning. Eftersom drygt 45 procent av eleverna tar examen från ett högskoleförberedande gymnasieprogram motsvarar det en minskning med nästan åtta procent. Sannolikheten att ta examen från ett STEM-program minskar med två procentenheter, vilket motsvarar en minskning med 12 procent. Medan sannolikheten att ta examen från samhällsvetenskapligt, ekonomiskt eller humanistiskt program är opåverkad av förändringen i betygsskala, minskar sannolikheten för att ta examen från det estetiska programmet med 1,6 procentenheter. En förändring i programsammansättning är inte nödvändigtvis en dålig sak om den orsakas av en förbättrad matchning mellan elever och program. Eftersom vi finner att förändringarna i programsammansättning åtföljs av en lägre andel som tar studenten, verkar dock så inte vara fallet.
En mer fingradig betygsskala har ingen statistiskt säkerställd effekt på sannolikheten att registrera sig på högskolan senast under våren det år personen fyller 21 år. Likaså påverkas inte sannolikheten att registrera sig på något av de fem mest populära lärosätena.[4] Antalet avklarade poäng på högskolan minskar med 0,65 poäng, vilket motsvarar en minskning med sju procent. Vi delar in högskolestudier i fyra ämnesområden som motsvarar de högskoleförberedande gymnasieprogrammen som nämnts ovan. Sannolikheten att registrera sig på ett STEM-program på högskolan minskar med 1,4 procentenheter eller mer än 16 procent. Vi hittar inga väsentliga förändringar i sannolikheten att registrera sig på ekonomiska, samhällsvetenskapliga eller humanistiska program, på estetiska program eller på övriga program.
Tabell 1. Effekter på utbildningsresultat
Anm: Estimerade effekterna av mer informativa betyg på utbildningsresultat, * p<0,1, ** p<0,05, *** p<0,01. Källa: Collins och Lundstedt (2024).
Heterogena effekter
Före införandet av den mer informativa betygsskalan var det mycket mer sannolikt att flickor tog examen från ett högskoleförberedande gymnasieprogram och från ekonomiska-, samhällsvetenskapliga eller humanistiska programmet, medan pojkar var mer sannolika att ta examen från STEM-program i gymnasiet och registrera sig på STEM-program i högskolan. Eftersom vi finner att mer informativa betyg påverkar val av program kan det även finnas könsskillnader i dessa effekter. Figur 1 visar effekten av en mer informativ betygsskala på vardera utfallet, separat för pojkar och flickor. För alla gymnasieutfall är effekten liknande för pojkar och flickor, bortsett från effekten av att ta studenten från ett STEM-program som är större för pojkar. På högskolenivå är den negativa effekten på sannolikheten att registrera sig på ett STEM-program nästan helt driven av pojkar. Pojkar upplever också en negativ effekt på sannolikheten att över huvud taget registrera sig på högskolan (statistiskt signifikant på tio procent-nivån). Flickor upplever inga betydande negativa effekter på något av de högskoleutfall vi studerar.
Vi undersöker också om effekterna skiljer sig åt beroende på elevens förmåga eller socioekonomisk bakgrund. Med införandet av mer informativa betyg ges nu högsta betyg till färre elever. Medan den genomsnittliga eleven riskerar att få en signal om att denne presterar sämre än vad den tror, kan elever med hög förmåga däremot få en signal om att de presterar bättre än vad de tror. Vi delar därför in eleverna i fem grupper baserat på deras estimerade förmåga men hittar, för de flesta utfall, negativa effekter i alla grupper.
Figur 1. Differentiella effekter efter kön
Anm: Estimerade effekterna av mer informativa betyg på utbildningsresultat, separat för pojkar och flickor. * p<0,1, ** p<0,05, *** p<0,01. Källa: Collins och Lundstedt (2024).
Det kan finnas heterogenitet baserat på socioekonomisk bakgrund eftersom resursstarka föräldrar har en större möjlighet att agera på de mer informativa betygen och investera mer i sina barns humankapital. Vi finner dock inga skillnader i effekter mellan hushåll med högre och lägre inkomster.
Mekanismer
För att förstå varför den mer informativa betygsskalan hade en negativ inverkan på elevers utbildningsresultat kompletterar vi vår analys med data från studien Health Behaviour in School-Aged Children (HBSC). HBSC är en internationell studie som organiseras av Världshälsoorganisationen och samlar in information om attityder till skolan och psykisk hälsa bland skolbarn. Data till HBSC samlas in vart fjärde år genom nationellt representativa urval av barn i åldrarna 11, 13 och 15. Vi använder data från undersökningar gjorda 2002, 2006, 2010 och 2014. Svenska barn födda 1998 hade en mer informativ betygsskala och ingick i HBSC vid 11 års ålder 2010 (före betygsreformen) och igen vid 15 års ålder 2014 (efter betygsreformen).
Vi jämför förändringarna i mental hälsa och attityder till skolan mellan 11 och 15 års ålder för barn födda 1998 med motsvarande skillnad hos tidigare kohorter som aldrig bedömdes enligt den mer informativa betygsskalan. För att ta hänsyn till trender inom psykisk hälsa jämför vi skillnaden mellan födelsekohorter i Sverige med motsvarande skillnad för samma födelsekohorter i Danmark och Norge.
Vi finner en minskning med 32 procent av sannolikheten att elever tror att de är bra eller mycket bra i skolan. Detta innebär att eleverna får ett lägre självförtroende när de får en mer exakt signal om sin prestation.
Med mindre informativa betyg får elever mer brus i signalen om sina prestationer. Med mer informativa betyg får elever i stället en mer exakt signal om sina prestationer. Om elevens uppfattning av den egna förmågan är korrekt kommer mer informativa betyg inte att påverka självförtroendet. Elever har dock sannolikt en överdriven uppfattning av sina egna förmågor (Dunning m fl 2004; Bobba och Frisancho 2019). Om elever med mer informativa betyg får reda på att de presterar sämre än vad de skulle ha trott under mindre informativa betyg, kan detta leda till minskad egenförmåga och sämre framtida prestationer.
Vi finner även att elever med mer informativa betyg rapporterade att de upplevde en sämre psykisk hälsa. Specifikt identifierar vi en ökning av sannolikheten att rapportera svårigheter att somna, vilket är ett symptom på ångest och stress. Detta identifieras på alla nivåer, från att uppleva sömnsvårigheter någon gång i månaden till att uppleva sömnsvårigheter på daglig basis. Vi identifierar också en ökning av sannolikheten för att elever känner sig pressade av sitt skolarbete.
- Diskussion
Våra resultat ger intressanta insikter om hur mer informativ feedback i grundskolan kan ha stora och ihållande effekter på utbildningsresultat, med viktiga implikationer för hur feedback utformas.
Resultaten av vår forskning tyder på att mer informativa betyg fungerar som en negativ chock för elevernas självförtroende och ökar stressnivåerna vilket i sin tur leder till sämre utbildningsresultat på lång sikt. Även om mer informativa betyg inte fungerade som avsett, betyder det inte nödvändigtvis att mer informativa betyg är dömda att misslyckas. Kombinerat med rätt åtgärder skulle mer informativa betyg kunna vara framgångsrika och förbättra elevernas resultat. För att mer informativa betyg ska ha en positiv effekt måste beslutsfattare ha ett helhetsperspektiv, där man exempelvis involverar lärarkåren för att säkerställa att dessa kombineras med lämpliga förväntningar bland lärare och ett dynamiskt tankesätt bland eleverna.
[1] Den data som används i denna studie kommer från the Swedish Interdisciplinary Panels (SIP) som administreras av Centrum för ekonomisk demografi vid Lunds universitet.
[2] Metoden kallas difference-in-discontinuity design.
[3] Så kallade kalendereffekter (school starting age effects), vilket syftar på fenomenet att barn som är födda tidigt på kalenderåret vanligtvis presterar bättre än barn som är födda sent på kalenderåret i länder där barn placeras i skolkohorter efter födelseår. I litteraturen förekommer framför allt två förklaringar till detta. Dels absolut mognad, dvs att lärande i skolmiljön är mer eller mindre effektivt vid vissa åldrar, dels relativ mognad, dvs att vara relativt äldre än sina kamrater ger barn en fördel i skolan (Fredriksson and Öckert 2014).
[4] De fem mest populära lärosätena definieras som de fem lärosäten som fått flest ansökningar under den period vi studerar. Dessa lärosäten är, i alfabetisk ordning: Göteborgs, Lunds, Stockholms, Umeå och Uppsala universitet.
Bandiera, O, V Larcinese och I Rasul (2015), ”Blissful Ignorance? A Natural Experiment on the Effect of Feedback on Students’ Performance”, Labour Economics, vol 34, s 13–25.
Bertrand, M, M Mogstad och J Mountjoy (2021), ”Improving Educational Pathways to Social Mobility: Evidence from Norway’s Reform 94”, Journal of Labor Economics, vol 39, s 965–1010.
Black, S E, P J Devereux och K G Salvanes (2011), ”Too Young to Leave the Nest? The Effects of School Starting Age”, The Review of Economics and Statistics, vol 93, s 455–467.
Bobba, M och V Frisancho (2019), ”Perceived Ability and School Choices”, manuskript, Yale University.
Bobba, M och V Frisancho (2020), ”Self-perceptions about Academic Achievement: Evidence from Mexico City”, Journal of Econometrics, vol 231, s 58–73.
Chevalier, A, S Gibbons, A Thorpe, M Snell och S Hoskins (2009), ”Students’ Academic Self-perception”, Economics of Education Review, vol 28, s 716–727.
Cobb-Clark, D A, T Ho och N Salamanca (2021), ”Parental Responses to Children’s Achievement Test Results”, IZA Discussion Paper 14663, Bonn.
Collins, M och J Lundstedt (2024), ”The Effects of More Informative Grading on Student Outcomes”, Journal of Economic Behavior & Organization, vol 218, s 514–549.
Dizon-Ross, R (2019), ”Parents’ Beliefs about their Children’s Academic Ability: Implications for Educational Investments”, American Economic Review, vol 109, s 2728–2765.
Dunning, D, C Heath och J M Suls (2004), ”Flawed Self-assessment: Implications for Health, Education, and the Workplace”, Psychological Science in the Public Interest, vol 5, nr 3, s 69–106.
Fischer, M och D Sliwka (2018) ”Confidence in Knowledge or Confidence in the Ability to Learn: An Experiment on the Causal Effects of Beliefs on Motivation”, Games and Economic Behavior, vol 111, s 122–142.
Fredriksson, P och B Öckert (2014), ”Life-cycle Effects of Age at School Start”, The Economic Journal, vol 124, s 977–1004.
Kőszegi, B, G Loewenstein och T Murooka (2022), ”Fragile Self-esteem”, The Review of Economic Studies, vol 89, s 2026–2060.
SFS (2010) Lag (2010:801) om införande av skollagen (2010:800), Justitiedepartementet, Stockholm.
Sjögren, A (2010), ”Graded Children: Evidence of Longrun Consequences of School Grades from a Nationwide Reform”, IFAU Working Paper 2010:17, Uppsala.
Stinebrickner, R och T Stinebrickner (2014), ”Academic Performance and College Dropout: Using Longitudinal Expectations Data to Estimate a Learning Model”, Journal of Labor Economics, vol 32, s 601–644.
Utbildningsdepartementet (2009) Uppdrag att utarbeta nya kursplaner och kunskapskrav för
grundskolan och motsvarande skolformer m m, Sveriges Regering.