NOU 2000: 14

Frihet med ansvar— Om høgre utdanning og forskning i Norge

Til innholdsfortegnelse

13 «Eksamen» innen høgre utdanning i Norge

Per Lauvås

13.1 Sammendrag

«Eksamen» brukes som en fellesbetegnelse på den endelige prøving av studenter. I norsk språkbruk brukes gjerne «eksamen» som en felles betegnelse på all avsluttende evaluering. Det skjelnes i evalueringslitteraturen mellom formativ (evaluering som intervensjon i studentenes læringsprosess) og summativ evaluering (kontroll av studentenes læringsresultater). Eksamen er her en betegnelse for den summative evalueringen. Selv om formativ evaluering også bør utvikles betydelig, vil denne siden ikke tas opp her 1. Eksamen styrer studentenes arbeid i stor grad 2. Det er en stadig sterkere erkjennelse av at eksamenspraksis (nesten uansett hvordan den faktisk er) er moden for revisjon. Den perfekte ordning finnes ikke. Viktige hensyn må veies mot hverandre; det er neppe mulig å finne fram til en ordning som tilfredsstiller alle rimelige krav. Problemet er at vi ofte, nesten umiddelbart, legger noen krav til grunn som selvfølgelige og nødvendige, hvilket innebærer at andre, like legitime krav avvises allerede i utgangspunktet.

13.2 Utviklingstendenser

I Australia har Boud 3 identifisert 3 stadier i utviklingen på eksamensområdet:

  • Tradisjonelle eksamener

  • Psykometriske tester (f eks «multiple-choice»)

  • «Autentisk» prøving (prøving i mer «naturlige» situasjoner med mer vekt på anvendelse av kunnskap og sterkere vektlegging av læringsaspektet)

I Norge er vi enda ikke kommet ut over den første fasen. I Australia er det også hevdet at «In an age of electronic learning, our tests and examinations are driven by steam.» Midtfasen har man mer erfaring med i andre land, men det er den tredje fasen vi bør interessere oss for.

At eksamen bør ha et mest mulig «autentisk preg», synes å være et hovedpoeng i nyere litteratur. Det er en upresis betegnelse og uttrykker mer en overordnet ambisjon enn beskrivelse av konkrete ordninger. Utenfor utdanningsinstitusjonene kartlegges, prøves og kontrolleres kompetanse på mer «autentiske» måter enn innenfor akademiske institusjoner. Dette reiser ikke bare snevre eksamensspørsmål, men mer omfattende spørsmål om forholdet mellom høgre utdanningsinstitusjoner og læring/kompetanseutvikling på andre arenaer, og om forholdet mellom akademisk utdanning og livslang læring i og utenfor institusjonene. Det er ikke bare intensjonen om å utvikle mer «autentiske» prøveformer som ligger bak den sterkt økende interessen for eksamensspørsmål, men den er kanskje den klareste fellesnevneren for den brede satsingen som nå foregår i en rekke land.

13.3 Eksamenskritikk

Undersøkelser i Norge tidlig på 70-tallet av validitet og reliabilitet ved universitetseksamener, førte verken til særlig debatt eller seriøse forsøk på forbedringer, selv om konklusjonene var relativt kritiske til eksisterende praksis. I internasjonal litteratur finnes et meget stort antall studier som stiller spørsmålstegn ved studentenes forståelse etter universitetsstudier, kanskje særlig innen naturvitenskapelige fag.

En fersk undersøkelse ved Danmarks Tekniske Universitet 4 har vakt betydelig oppmerksomhet. Studentene ble evaluert ved den endelige eksamen (på vanlig vis) og ved en alternativ prøveform som ble utviklet i samarbeid med fagmiljøene. Undersøkelsen viser at:

«Der er typisk 45% af de studerende der både har deltaget i sluttest og eksamen i projektet, der klarer sig relativt dårligt i den test læreren selv har lavet af forståelsen af det han anså være det centrale, men som klarede sig relativt godt til eksamen. ... Sluttelig skal det understreges, at det grundlæggende i resultaterne i høj grad svarer til, hvad der er fundet ved en række undersøgelser af universitetsstuderendes forståelse i forskellige land og inden forskellige fagområder. ... En stor del af de studerende der består eksamen, og endda ofte med godt resultat, har en ringe forståelse af fagenes centrale begreper. (Jakobsen m fl 1999, s 35-36)»

Studiene som foreligger er for det meste hentet fra naturvitenskapelige fagområder og gir forskningsmessig belegg for å hevde at riktige besvarelser til eksamen ikke nødvendigvis er indikasjon på at studentene har ervervet seg forståelse av sentrale elementer i faget, selv i «eksakte» fag.

13.4 Hvorfor slik oppmerksomhet om eksamen nå?

I Norge er økonomiske forhold viktige. Den omfattende modulariseringen av høgre utdanning, har medført sterk økning i antall eksamener. Å gjennomføre eksamen som tidligere, krever store ressurser. De siste års budsjettinnstramminger har ikke bare rammet undervisningen hardt. Det er også blitt tvingende nødvendig å se kritisk på utgiftene til eksamen 5. Da er det mer interessant å lete etter muligheter til å lage billigere og bedre eksamener, ikke bare mindre av det man har.

En relativt tung utgiftspost er eksterne sensorer. Universitetsloven pålegger bruk av ekstern sensor ved alle eksamener i høgre utdanning 6. Ekstern sensur representerer omtrent den eneste kvalitetssikringen av eksamen. Riktignok kan man stille spørsmål om hvordan ordningen virker i praksis. Men det er nødvendig å stille spørsmålet om hvordan eksamen nå skal kvalitetetssikres dersom bruken av ekstern sensur blir redusert. På dette punktet burde det være mulig å hente impulser til justeringer fra andre land, slik at den eksterne sensorfunksjonen kunne gjøres rimeligere og mer målbevisst som kvalitetssikring.

13.5 Krav til en «eksamensordning»

Boud 7 hevder at evaluering med tanke på sertifisering og kontroll er så dominerende at evaluering som bidrar til bedre læring er blitt helt uvesentlig 8. Ambisjonene ved utenlandske universiteter går i retning av å få en bedre balanse mellom kontroll- og læringsaspektet. Men lokale tradisjoner er svært sterke på dette feltet. Eksisterende praksis videreføres fordi «det må være slik». Det er derfor mange «selvsagte» ting man bør stille spørsmål ved.

Uten å gjøre krav på fullstendighet, kan nedenstående liste 9 i det minste anskueliggjøre bredden i krav og hensyn:

Tabell 13.1 

Aspekter ved evalueringBeskrivelse
Legitimitet:Studenter, lærere, administrasjonen, potensielle arbeidsgivere, o.a. aksepterer evalueringen som rimelig og rettferdig.
Standardisering:Evalueringssituasjonen er så lik som mulig for alle studenter (tid, oppgaver, utstyr, osv.).
Objektivitet:Det sørges for at bare det «objektet» evalueres, som er ment å skulle evalueres (kunnskap, ferdigheter, osv.) og ikke noe annet (personlig vennskap, slektskap, arbeidsrelasjoner, osv.). Anonymisering brukes ofte for å få til dette.
Reliabilitet:Det settes inn tiltak for å sikre presisjon i evalueringen (mht evalueringsskala) og mellom vurderingene til ulike personer som evaluerer.
Målrelevans (indre validitet):Evalueringen er designet slik at den dekker det området som skal evalueres, både mht innholdsområder og nivå. Bedømmerne skal bruke de samme kriterier, tolkninger og forståelse.
Ytre (økologisk) validitet:Det som blir evaluert er relevant i forhold til utdanningens totale formål; den kunnskap/ kompetanse som utdanningen skal gi.
Praktiske sider:Det er optimal balanse mellom ressursbruk (budsjett, arbeidsmengde, tilgjengelige evaluatorer, tid til å utføre evalueringsarbeidet, osv.) og omfanget på modulen/kurset (vekttall, innholdets karakter, osv.).
Formative aspekt:Intensjonen er at evalueringen skal fremme studentenes læring i tillegg til at den fungerer som kontroll.
Rettssikkerhet:Såvel studentenes som bedømmernes juridiske rettigheter ivaretas for å forebygge og minimalisere vilkårlighet og overgrep.
Konfidensialitet:Det sikres at sensitive data ikke spres.
Offentlighet:Det sikres innsyn og åpenhet i evalueringen slik at minst mulig foregår bak lukkede dører, unndratt innsyn.
Kommunikasjon:Evalueringen legger opp til dialog om hva som er relevant kunnskap og om kriteriene som evalueringen skjer ut fra.

Tradisjonene i høgre utdanning i Norge vektlegger en del av disse kravene mer enn andre. Og det hører med til sterke tradisjoner at den iboende vektleggingen i stor grad tas for gitt. Men det er ingen nødvendighet at f.eks. standardisering, reliabilitet og målrelevans (i form av indre validitet) skal og må tillegges en slik vekt. Ambisjonene ved universiteter rundt i verden går i retning av å gi støre vekt til andre krav på listen, f.eks. ytre validitet, formative aspekter og kommunikasjon.

Alle legitime krav til en evalueringsordning kan ikke tilfredsstilles like godt, man må faktisk velge. Når det skal prioriteres, gjelder det alltid at det er relativt overkommelig å enes om hva som skal stå øverst på lista og tiltagende vanskeligere å enes om hva som skal plasseres lenger nede. Det kan hende at de tradisjonelt høyt prioriterte krav, f.eks. de som er nevnt over, ikke lenger, så å si automatisk, bør plasseres langt oppe på prioriteringslisten. Summativ evaluering skal først og fremst tjene kontrollformål, men dessuten bør andre, viktige hensyn ivaretas, og det er ikke likegyldige hvilke krav som blir vektlagt.

13.6 Hovedformer av summativ evaluering

I den overveldende litteraturen om eksamen er det ikke lett å finne noen prinsipielle holdepunkter og noe entydig klassifikasjonsgrunnlag. Med fare for å forenkle feltet mer enn det er dekning for, kan vi skille mellom tre hovedformer:

  • Eksamen ved avsluttende prøver

  • Dokumentasjon (eksamen på grunnlag av porteføljer)

  • Standpunktvurdering 10

I norsk språkbruk er «eksamensordninger» en fellesbetegnelse for alle disse tre formene. Det skulle for så vidt være unødvendig å skrive «eksamen ved avsluttende prøver» for eksamen er nettopp kjennetegnet ved at den er en (eller flere) avsluttende prøve(r). De to andre hovedformene atskiller seg nettopp fra eksamen ved at de ikke har form av avsluttende prøver 11. Dette forholdet er formodentlig ikke bare en terminologisk uklarhet; det innebærer at det faktisk er et forståelsesproblem vi har i vår tradisjon at summativ evaluering oppfattes som synonymt med «eksamen».

Eksamen er definert ved at et studieforløp deles i 2: først går studentene igjennom en læreprosess, deretter arrangeres en separat prøvefase som er en mest mulig rendyrket og standardisert prøvesituasjon. Det er grunn til å stille spørsmålstegn ved den oppfatning at de tradisjonelle eksamener har noen større verdi som læringselement. Det er heller det motsatte som er problemet; prøvesituasjonen er til de grader utformet som en kontrollsituasjon at det er vanskelig å finne tilsvarende «sterile» prøvesituasjoner utenfor utdanningsinstitusjonene.

En endring av denne formen for evaluering kan bestå i at prøvene og prøveformen gjøres mer forståelsesrettete og mer autentiske, dvs i høyere grad avspeiler de situasjoner der kompetansen skal anvendes, f.eks. i senere profesjonell virksomhet. Utvikling i retning av mer «autentisk» prøving kan man delvis oppnå uten strukturelle endringer i evalueringsordningene, men gjennom de oppgaver som gis.

I problembaserte studieforløp (medisin) har man f.eks. utviklet prøveformer som er ment å skulle gi en mer «autentisk» prøvesituasjon enn de tradisjonelle formene, såkalte flerfase-eksamen («triple- (evt «quadruple-») jump examinations»):

Tabell 13.2 

Trinn 1:Studentene får en skriftlig pasientbeskrivelse som skal utredes skriftlig (1/2 t.).
Trinn 2:Dernest får studentene utlevert et laboratoriemateriale som er knyttet til det samme pasientkasus. Individuell, skriftlig utredning (1 t.)
Trinn 3:Selvstudium, helst kombinert med arbeid i gruppe (for at prøvesituasjonen skal likne mest mulig framtidig arbeidssituasjon). Alle kilder er tilgjengelige.
Trinn 4:Dagen etter de to første trinnene holdes individuell muntlig eksamen (1/2 t.)

Prøveformen er gjort tilstrebet «autentisk» gjennom å legge den så nær opp til den kliniske hverdag som mulig. I klinisk praksis må man alltid vite - stilt overfor ett bestemt tilfelle - om man har tilstrekkelig paratviten eller om man må lese seg opp/ konsultere med andre. Samarbeid om oppgaveløsningen kombineres derfor med selvstendig prøving. Det forventes at studentene skal søke relevante kilder i stedet for å dokumentere paratviten. Grunnleggende forståelse er mer nødvendig enn memorert informasjon.

Dokumentasjon12 er blitt en høyst aktuell term på grunn av nyere utredninger og innstillinger. Begrepet «dokumentasjon» (f eks i Buerutvalgets innstilling, i «Realkompetanse i høgre utdanning») 13 er ikke definert eller sammenholdt med «portfolio assessment» i internasjonal litteratur. Dels brukes det som et overordnet begrep, nesten synonymt med «summativ evaluering» og dels synonymt med «attestasjon». I denne framstillingen legges innholdet i den internasjonale faglitteraturen til grunn.

Dokumentasjon er basert på en annen logikk enn eksamen. Det arrangeres ikke en konstruert prøvesituasjon etter avsluttet læringsforløp. I stedet nedfelles studentenes læringsprosess og -resultater i en eller annen dokumenterbar form under læringsforløpet, og det er et redigert utvalg av det samlede dokumentasjonsmaterialet som legges fram til den endelige vurderingen. Hensikten med dokumentasjon er bl.a.:

  • Gjøre prøvingen mest mulig «autentisk».

  • Innarbeide ferdigheter og positive holdninger slik at dokumentasjon blir en integrert del av kunnskaps- og kompetanseutvikling, så vel i arbeids- som i studiesammenheng.

  • Oppnå maksimalt positiv tilbakevirkning på studentenes studieaktivitet.

Denne formen utvikles nå i relativt bred skala rundt om i verden. Innenfor noen fag vil man nærmest automatisk avgrense en portefølje til skriftlige rapporter/ oppgaver, hvilket ikke er nødvendig. I andre fag kan porteføljen danne rammen rundt arbeider studentene allerede skal gjøre (lab.-rapporter, obligatoriske oppgaver osv) slik at slike arbeider ikke vurderes separat, men inngår i det samlede materialet i porteføljen.

Kombinasjon av avsluttende prøve og portefølje gir muligheter for å trekke inn studentarbeider av ulikt slag (porteføljedelen) med en (gjerne tradisjonell, men oftest mindre) avsluttende prøve. En slik ordning har flere fordeler, bl.a.:

  • Utelukkende intensiv eksamenslesning blir nærmest gjort umulig.

  • Den avsluttende prøven legge vekt på forståelse (studentene bringer sine porteføljer med til den avsluttende prøven).

  • Kontrollaspektet løses bedre enn ved ren porteføljevurdering.

  • Kombinasjon av formativ og summativ vurdering blir relativt uproblematisk.

En evalueringsordning kan være en kombinasjon av alle hovedformene. Tradisjonen ved amerikanske universiteter er f.eks. ulike versjoner av eksamen (til slutt og mindre prøver under veis), standpunktvurdering, eventuelt også med innslag av dokumentasjon.

Fotnoter

1.

I internasjonal litteratur framheves bl.a. at 'peer assessment' og 'self assessment' må styrkes, noe som først og fremst (men ikke bare) har betydning for den formative evalueringen.

2.

«The curriculum tells you what the faculty is doing; the examination system tells you what the students are doing.» (Boud 1995)

3.

Boud, D (1995): Assessment and learning: contradictory or complementary? I: Knight, P (Ed.): Assessment for Learning in Higher Education. Staff and Educational Development Series. London: Kogan Page

4.

Jakobsen, A, Rump, C, Clemmensen, T & May, M (1999): Kvalitetsudviklingsprojektet «Faglig Sammenhæng» - Hovedrapport. CDM's skriftserie nr. 1, Danmarks Tekniske Universitet

5.

De få beregninger av omkostningene ved eksamen som finnes, burde tilsi at minst 20-25% av ressursene som brukes til undervisning, dekker de direkte eksamensutgiftene, og at ca. halvparten av dette går til ekstern sensur. Andre omkostninger enn direkte utbetalinger er da ikke tatt med.

6.

Ekstern sensur er lovhjemlet i Danmark og Norge og vanlig i Storbritannia. I Danmark er kravet at minst 1/3 av eksamenen i et program skal være med ekstern sensur, mens kravet hos oss omfatter alle eksamener og alle elementer. I Sverige brukes ekstern sensur minimalt. I Högskoleutredningen (1992) ble det anbefalt å prøve ut innslag av ekstern sensur, uten at staten skulle pålegge institusjoner noe krav. Det er nå gitt adgang til tidsbegrensete forsøk med eksamen uten ekstern sensur i Norge.

7.

Boud, D (1995): Ensuring that assessment contributes to learning. Proceedings from PBL International Conference, September 24-27, Linköping University

8.

Boud viser her til litteraturen. I praksis er vel tendensen enda sterkere?

9.

Lauvås, P, Havnes, A & Raaheim, A (2000): Why this inertia in the development of assessment methods? Quality in Higher Education, 6:1, in press. En tilsvarende liste finnes i: Lindberg-Sand, Å & Askling, B (1991): Examination som kvalitetskontroll i högskolan. (SOU 1991:44) Sammenfallet mellom disse 'kravspesifikasjonene' er imidlertid ubetydelig.

10.

Standpunktvurdering (f eks 'continuous assessment') er et mer uklart alternativ enn eksamen og dokumentasjon og vil ikke tas opp her.

11.

På dette punktet er standpunktvurdering prinsipielt uklar. 'Continuous assessment' kan bestå av flere, mindre prøver underveis. I så fall er det snakk om 'eksamen', men bare i mindre deler av stoffet. Tendensen til å anvende dette alternativet ser ut til å være økende, selv om man kan (og bør) stille store spørsmålstegn ved den.

12.

Det er enda ikke etablert noen omforenet terminologi i Skandinavia. På engelsk brukes 'portfolio assessment', noe som er kalt mappe-vurdering, porteføljevurdering med mer på norsk.

13.

NOU 1997:25, NOU 1999:17, Innstilling av 1999-04-19.

Til forsiden