NOU 1999: 17

Realkompetanse i høgre utdanning— Dokumentasjon av realkompetanse og etablering av kortere og tilpassede studieløp i høgre utdanning

Til innholdsfortegnelse

4 Omnibusundersøkelse – mars 1999

Statistisk sentralbyrå

Elisabeth Rønning

Statistisk sentralbyrås omnibusundersøkelse –Dokumentasjonsrapport mars 1999

Tabell 1 

Nøkkeltall for hovedutvalg:PersonerProsent
Personer trukket ut for intervju2000100,0
Avgang (døde og personer flyttet til utlandet)19
Bruttoutvalg1981100,0
Nettoutvalg (personer oppnådd intervju med)126063,6
Frafall72136,4
Viktigste årsaker til frafall:32545,1
Ønsker ikke å delta8812,2
Har ikke tid nå
Grupper som i forhold til kjennemerkene kjønn, alder og landsdel er over-eller underrepresentert i nettoutvalget med mer enn + 1 prosentpoeng.
Kjønn:
Mann+ 2,2
Kvinne- 2,9
Alder:
25 – 44 år+ 1,7
67 – 79 år- 3,1
Landsdel:
Akershus og Oslo- 2,4
Agder og Rogaland+ 1,1
Trøndelag+ 1,4

Tabell 2 

Nøkkeltall for hovedutvalg + tilleggsutvalg:PersonerProsent
Personer trukket ut for intervju2600100,0
Avgang (døde og personer flyttet til utlandet)23
Bruttoutvalg2577100,0
Nettoutvalg (personer oppnådd intervju med)167965,2
Frafall89834,8
Viktigste årsaker til frafall:
Ønsker ikke å delta40945,5
Har ikke tid nå10011,1
Grupper som i forhold til kjennemerkene kjønn, alder og landsdel er over-eller underrepresentert i nettoutvalget med mer enn + 1 prosentpoeng.
Kjønn:
Kvinne- 1,4
Alder:
16 – 24 år+ 1,6
67 – 79 år- 2,7
Landsdel:
Akershus og Oslo- 1,8
Agder og Rogaland+ 1,3
Vestlandet- 1,1
Trøndelag+ 1,1

Omnibusundersøkelser

Statistisk sentralbyrås omnibusundersøkelser er satt sammen av mange ulike tema på vegne av flere oppdragsgivere. Undersøkelsene består av et fast sett med bakgrunnsvariabler pluss de spørsmålene som oppdragsgiverne betaler for.

Oppdragsgivere og tema – Omnibus nr. 1 1999

  • Norsk institutt for studier av forskning og utdanning: Kunnskap / holdninger / interesse for vitenskap og teknologi

  • Utvalg for høgre utdanning / KUF: Utdanningskurs

  • Statens tobakksskaderåd: Røykevaner

  • SSB, Seksjon for samferdsels- og reiselivsstatistikk: Reiser siste 3 måneder

  • SSB, Seksjon for demografi- og levekårsforskning : Forventet barnetall

  • SSB, Seksjon for folke- og boligtelling: Hvem man bor sammen med / testing av boligskjema

  • SSB, Seksjon for levekårsstatistikk: Metodespørsmål

Datainnsamling

Feltarbeidet ble gjennomført over tre og en halv uke i perioden 1. til 24 mars. På grunn av veldig lav svarprosent etter den oppsatte tiden, ble det bestemt å fortsette intervjuingen ut første uke etter påske. Seniorintervjuerne i intervjuerkorpset jobbet spesielt med oppfølging av frafallet denne siste tiden, men også underveis i hele feltperio-den.

61 prosent av hovedutvalget er gjennomført som besøksintervju (intervjuerne oppsøker respondentene personlig). De resterende 39 prosent av intervjuene er gjennomført over telefon. Det er gitt tillatelse til telefonintervju i de tilfeller respondenten ellers vil nekte å delta, når reiseavstanden mellom intervjuer og respondent er særlig lang eller når respondenten har flyttet til et område av landet hvor SSB ikke har intervjuere i nærheten. I frafallsoppfølgingen blir det også i større grad enn ellers brukt telefonintervju, da det er våre seniorintervjuere som tar seg av dette, og det kan være vanskelig å tilpasse IOs bosted etter hvor seniorintervjuerne våre bor. Hele tilleggsutvalget har blitt intervjuet over telefon.

Utvalg og tilleggsutvalg

Til undersøkelsen ble det trukket ut 2000 personer i alderen 16-79 år (alder pr. 31.12.98). Noen i utvalget vil derfor være fylt 80 år. Det er også trukket et tilleggsutvalg på 600 personer i alderen 16-66 år som bare har fått spørsmål om utdanningskurs i tillegg til bakgrunnsspørsmålene. Utvalget av personer er trukket i to trinn med utgangspunkt i SSBs standard utvalgsplan.

I utvalgsplanen er hele landet inndelt i et sett av utvalgsområder, som igjen er gruppert i 109 strata. Utvalgsområdene er kommuner eller grupper av kommuner. Kommuner med lavt innbyggertall er slått sammen med andre kommuner, slik at alle utvalgsområder har minst 7 prosent av samlet innbyggertall i det stratumet området tilhører. I en del tilfeller er mindre omegnskommuner til folkerike kommuner slått sammen med den store kommunen til ett område. Alle kommuner med mer enn 30000 innbyggere og en del kommuner med mellom 25000 og 30000 innbyggere er tatt ut som egne strata. De andre utvalgsområdene er stratifisert innen hvert fylke etter næringsstruktur, bosettingstetthet, sentralitet, pendlings- og handelsmønstre, mediadekning og kommunika-sjoner. I første trinn trekkes et utvalgsområde fra hvert stratum. Utvalgsområder som utgjør egne strata er trukket ut med 100 prosent sannsynlighet. De resterende er trukket ut med en sannsynlighet proporsjonal med innbyggertallet i utvalgsområdet. I andre trinn er utvalget av personer trukket tilfeldig fra de 109 utvalgsområdene. Trekkingen på andre trinn foregår slik at utvalget er selvveiende når begge trinn ses under ett. Hovedutvalget og tilleggsutvalget er selvveiende både hver for seg og sett under ett.

Frafall

Av de 2000 personene i hovedutvalget som ble trukket ut for intervju, var 19 personer flyttet til utlandet eller døde. Disse tilhører derfor ikke målpopulasjonen og er utelatt. Bruttoutvalget utgjør dermed 1981 personer. Av disse ble det oppnådd intervju med 1260 personer, eller 63,6 prosent. Frafallet utgjør dermed 36,4 prosent.

Av de 2600 personene fra hovedutvalget når tilleggsutvalget er inkludert, var 23 personer flyttet til utlandet eller døde. Disse tilhører ikke målpopulasjonen og er utelatt. Bruttoutvalget utgjør derfor i dette tilfellet 2577 personer. Av disse ble det oppnådd intervju med 1679 personer, eller 65,2 prosent. Frafallet utgjør 34,8 prosent.

Intervjuerne er pålagt å sende inn gjennomførte intervju og bekreftede frafall for hver dag. Det er dermed mulig å få en oversikt over svarinngangen gjennom intervjuperioden.

Tabell 4.1 og tabell 4.2 viser at nekting er den vanligste årsaken til frafall i hovedutvalget og hovedutvalget inkludert tilleggsutvalget. Nekting omfatter 63 prosent av frafallet og 23 og 22 prosent av bruttoutvalget. 17 og 19 prosent av frafallet skyldes at IO ikke er truffet i intervjuperioden. 14 og 13 prosent av frafallene skyldes at IO er forhindret fra å delta, enten på grunn av sykdom eller språkproblemer. Resten av frafallet skyldes andre årsaker.

Tabell 4.1 Frafall etter årsak – hovedutvalg

  Antall personerProsent av frafallProsent av bruttoutvalg
Frafall i alt721100,036,4
Ønsker ikke å delta45362,822,9
Forhindret fra å delta10414,45,2
Ikke truffet12216,96,2
Annet frafall425,82,1

Tabell 4.2 Frafall etter årsak – hovedutvalget og tilleggsutvalget

  Antall personerProsent av frafallProsent av bruttoutvalg
Frafall i alt898100,034,8
Ønsker ikke å delta56162,521,8
Forhindret fra å delta11212,54,3
Ikke truffet16718,66,4
Annet frafall586,52,3

Utvalgsskjevhet

Frafall fører til utvalgsskjevhet når fordelingen av et bestemt kjennemerke er annerledes blant de som svarte (nettoutvalget) enn blant de som ble forsøkt intervjuet (bruttoutvalget). Utvalgsskjevhet i forhold til ett kjennemerke medfører ikke nødvendigvis at nettoutvalget er skjevt i forhold til andre kjennemerker. Omvendt innebærer godt samsvar mellom fordelingene i netto- og bruttouvalget for ett eller flere kjennemerker ikke noen garanti for at utvalget ikke er skjevt på andre kjennemerker.

Tabell 4.3 Bruttoutvalg, nettoutvalg og frafall etter kjønn alder og landsdel. Hovedutvalg. Prosent

  BruttoNettoFrafall
I alt100.0100.0100.0
Kjønn
Mann50.152.346.2
Kvinne49.947.753.8
Alder
16-24 år14.715.213.9
25-44 år39.741.436.8
45-66 år30.831.729.3
67-79 år14.711.620.1
Landsdel
Akershus og Oslo21.819.425.9
Hedmark og Oppland8.78.98.3
Østlandet ellers18.418.218.9
Agder og Rogaland13.714.811.8
Vestlandet17.816.919.4
Trøndelag8.910.36.5
Nord-Norge10.711.59.2
Antall personer19811260721

Tabell 4.3 tar utgangspunkt i hovedutvalget på 2000 personer, og viser hvordan kjennemerkene kjønn, alder og landsdel er fordelt i bruttoutvalget, frafallet og nettoutvalget. Vi ser at menn er overrepresentert med 2,2 prosent og kvinner er underrepresentert med 2,9 prosent i nettoutvalget. Dette er mot normalt i omnibusundersøkelsene. Det kan hende at noen av temaene i denne undersøkelsen appellerer sterkere til menn enn til kvinner. Aldersmessig er det en viss overrepresentasjon av personer i aldersgruppen 25 – 44 år og en underrepresentasjon på 3,1 prosentpoeng av personer mellom 67 og 79 år. Frafallet har også ført til en underrepresentasjon av personer fra Akershus og Oslo og en overrepresentasjon av personer fra Agder og Rogaland og Trøndelag.

Skjevhetene for den eldste aldersgruppen og for kvinnene er i denne undersøkelsen ganske stor. Ved analyser av variabler som korrelerer sterkt med alder og kjønn, kan det vurderes å vekte resultatene for å få mer korrekte estimat for befolkningen totalt. Samtidig er det grunn til å minne om at vekting reduserer skjevheter bare dersom det for de kjennemerkene som blir brukt ved vekting er slik at de personene i ei gruppe som har svart er representative for dem som ikke har deltatt. Dersom dette ikke er en riktig antakelse, vil vekting kunne føre til at resultatene ligger lenger unna populasjonens sanne verdi enn det som er tilfellet uten vekting.

Tabell 4.4 viser hvordan kjennemerkene kjønn, alder og landsdel er fordelt i bruttoutvalget, frafallet og nettoutvalget når vi også inkluderer tilleggsutvalget på 600 personer. Kjønnsfordelingen er her i hovedsak lik når vi sammenliker brutto- og nettoutvalget, men det er en liten underrepresentasjon av kvinner når vi sammenlikner netto- og bruttoutvalget. Vi ser at de samme aldersmessige over- og underrepresentasjonene viser seg her, men i noe svakere grad. Underrepresentasjonen av personer mellom 67 og 79 år er ikke fullt så høy når tilleggsutvalget inkluderer, men den er fortsatt på 2,7 prosent. Frafallet har også her ført til en underrepresentasjon av personer fra Akershus og Oslo og en overrepresentasjon av personer fra Agder og Rogaland og Trøndelag. I tillegg er personer fra Vestlandet underrepresentert i nettoutvalget med i overkant av 1 prosentpoeng.

Tabell 4.4 Bruttoutvalg, nettoutvalg og frafall etter kjønn alder og landsdel. Hovedutvalg med tilleggsutvalg. Prosent

  BruttoIntervjuFrafall
I alt100.0100.0100.0
Kjønn
Mann49.651.047.1
Kvinne50.449.052.9
Alder
16-24 år15.115.813.6
25-44 år39.441.036.3
45-66 år33.733.933.2
67-79 år11.99.216.9
Landsdel
Akershus og Oslo20.718.924.2
Hedmark og Oppland9.09.08.9
Østlandet ellers19.019.218.6
Agder og Rogaland13.815.111.4
Vestlandet18.117.020.2
Trøndelag8.89.96.8
Nord-Norge10.610.910.0
Antall personer25771679898

Utvalgsvarians

Fordi resultatene bygger på opplysninger om et utvalg av den befolkningen som undersøkelsen dekker, er det knyttet en viss usikkerhet til dem. Denne usikkerheten kalles utvalgsvarians. I og med at utvalget er trukket etter reglene for tilfeldig utvalg, er det mulig å beregne hvor stor utvalgsvariansen kan ventes å bli.

Et hyppig brukt mål på usikkerheten i resultatet for et kjennemerke, er standardavviket til den observerte verdien av dette kjennemerket. Størrelsen på dette standardavviket avhenger av tallet på observasjoner i utvalget, måten utvalget er trukket på og av fordelingen til det aktuelle kjennemerket i befolkningen. Fordelingen i befolkningen kjenner vi ikke, men det er mulig å anslå standardavviket ved hjelp av observasjonene i utvalget.

Det er ikke foretatt egne beregninger av slike anslag for denne undersøkelsen, men tabell 5 viser størrelsen på standardavviket for observerte prosentandeler ved ulike utvalgsstørrelser. Av tabellen går det fram at usikkerheten øker når antall observasjoner minker og når prosenttallet nærmer seg 50.

Tabell 4.5 Forventet standardavvik for observerte prosentandeler ved ulike utvalgsstørrelser.

Antall observasjoner5/9510/9020/8030/7040/6050/50
255,47,510,011,512,212,5
503,85,27,08,08,68,7
1002,73,74,95,66,06,2
2001,92,63,54,04,34,3
3001,52,12,83,23,53,5
5001,21,62,22,52,72,7
10000,81,21,51,81,91,9
12000,81,11,41,61,71,8
15000,70,91,31,41,51,6
20000,60,81,11,31,31,4
25000,50,71,01,11,21,2
30000,50,70,91,01,11,1

Ved hjelp av standardavviket er det mulig å beregne et intervall som med en bestemt sannsynlighet inneholder den sanne verdi av en beregnet størrelse (den verdien vi ville ha fått dersom vi hadde foretatt en totaltelling i stedet for en utvalgsundersøkelse). Slike intervaller kalles konfidensintervaller hvis de er konstruert på en bestemt måte: La M være den beregnede størrelsen og S være et anslag for standardavviket til M. Konfidensintervallet med grensene (M-2S) og (M+2S), vil med omtrent 95 prosents sannsynlighet inneholde den sanne verdien.

Følgende eksempel illustrerer hvordan en kan bruke tabell 4.5 for å finne konfidensintervaller: Anslaget på standardavviket til et observert prosenttall på 70 er 2,5 når antall observasjoner er 500. Konfidensintervallet for den sanne verdi får grensene 70 ± 2 x 2,5. Det vil si at intervallet som strekker seg fra 65 til 75 prosent med 95 prosent sannsynlighet inneholder den tallstørrelsen en ville fått om hele befolkningen hadde vært med i undersøkelsen.

Konfidensintervall kan konstrueres for ulike sikkerhetsnivå. Et konfidensintervall med grensene (M+S) og (M-S) vil med 68 prosent sannsynlighet inneholde populasjonens sanne verdi. Et konfidensintervall med grensene (M+2,6S) og (M-2,6S) vil med 99 prosent sannsynlighet inneholde populasjonens sanne verdi.

Ofte er det ønskelig å sammenlikne prosenttall for flere grupper. Når to usikre tall sammenliknes, vil usikkerheten på forskjellen mellom dem vanligvis bli større enn usikkerheten knyttet til hvert enkelt tall. Standardavviket til forskjeller mellom to prosenttall er lik kvadratroten av summen av kvadratene av standardavvikene til enkelttallene. Når en har anslag for standardavviket til slike forskjeller, kan en konstruere konfidensintervall for den sanne verdi på samme måte som beskrevet ovenfor.

Innsamlings- og bearbeidingsfeil

I enhver undersøkelse, både i totaltellinger og utvalgsundersøkelser, vil det forekomme svar som er feil. Feilene kan oppstå både i forbindelse med innsamlingen og under bearbeidingen.

All datainnsamling i denne undersøkelsen har foregått ved hjelp av bærbare pc?er. Dette foregår på den måten at intervjuerne har med seg pc ut i felten, leser opp spørsmålene fra dataskjermen og registrerer svarene direkte.

En viktig fordel med denne innsamlingsmetoden er at alle hopp i spørreskjema og tildeling av spørsmål til undergrupper programmeres på forhånd. Dermed reduseres mulighetene for at intervjuerne stiller feil spørsmål til feil personer. Tildelingen av spørsmål kan defineres på grunnlag av kjennetegn vi har om intervjupersonene på forhånd, men vi bruker også de svarene som blir gitt underveis i spørreskjemaet. En fare ved forhåndsprogrammerte spørsmål er at eventuelle programmeringsfeil kan bli gjennomgående.

En fordel med edb-assistert intervjuing er mulighetene for direkte kontroll av svarene som blir registrert. For hvert spørsmål er det lagt inn grenser for gyldige verdier. I tillegg er det bygget inn et omfattende feilmeldingssystem dersom intervjueren taster inn et svar som er inkonsistent i forhold til tidligere svar. Slike svarkontroller er lagt inn på to nivå. En del feilmeldinger er absolutte, og kan ikke overstyres. Andre ganger legges det inn advarsler som intervjuerne kan velge å se bort fra.

Videre gir edb-assistert intervjuing muligheter for å tilpasse ordlyden i spørsmålene avhengig av intervjupersonenes situasjon eller svar på tidligere spørsmål. Dette gir intervjusituasjonen et mer personlig preg, og det er lettere for intervjuerne å få til en muntlig samtale.

Alle disse sidene ved edb-assistert intervjuing fører til økt datakvalitet og innsamlingsfeil som skyldes intervjuerens feilregistreringer blir langt mindre enn ved bruk av papirskjema. Vi unngår registrering av ugyldige verdier og vi oppnår et redusert frafall på enkeltspørsmål ved at mulighetene for hoppfeil reduseres.

Innsamlingsfeil kan også komme av at intervjupersonen avgir feil svar. Det kan skyldes vansker med å huske forhold tilbake i tiden. Det kan også skyldes misforståelser av spørsmål. Når det blir spurt om forhold som folk erfaringsmessig finner kompliserte, må en regne med å få en del feilaktige svar. Innsamlingsfeil kan også oppstå fordi visse spørsmål av enkelte oppfattes som ømtålige. Intervjupersonene kan i slike tilfeller bevisst gi feilaktige svar. De vurderinger som ligger til grunn for svaret kan også bli påvirket av hva intervjupersonen oppfatter som sosialt ønskelig.

Bearbeidingsfeil er avvik mellom den verdien som registreres inn og den verdien som til slutt rapporteres ut. Slike feil kan oppstå for eksempel under omkodinger. Gjennom kontroller har man søkt å finne feil og rette opp disse.

Når en har rettet opp feil så langt det er mulig, er erfaringen at de statistiske resultatene i de fleste tilfeller påvirkes forholdsvis lite av både innsamlingsfeil og bearbeidingsfeil. Virkningen av feil kan likevel være av betydning i noen tilfeller, og det er klart at ikke alle feil oppdages.

Til forsiden