3 Kartlegging av omfanget og sammensetningen av vanskeligstilte på boligmarkedet – en dokumentasjonsrapport
Tor Morten Normann, Statistisk sentralbyrå
I produksjon av tall om ulike grupper av leietakere og vanskeligstilte på boligmarkedet er det brukt data fra den norske levekårsundersøkelsen EU-SILC 2007 – 2009.
EU-SILC er en europeisk utvalgsundersøkelse om inntekt og levekår som er samordnet via EUs statistikkorgan Eurostat. Undersøkelsen er årlig og populasjon for den norske undersøkelsen er personer 16 år og over bosatt i Norge, utenfor institusjon.
I 2009 utgjorde bruttoutvalget til undersøkelsen om lag 8 900 personer (antall personer trukket, fratrukket antall døde og utvandrede i løpet av feltperioden). Vi oppnådde svar fra i underkant av 5 500 personer (nettoutvalg), noe som tilsvarer en svarprosent på 61,2. I 2008 utgjorde bruttoutvalget til undersøkelsen om lag 8 800 personer. Vi oppnådde svar fra i overkant av 5 500 personer (nettoutvalg), noe som tilsvarer en svarprosent på 63,2. I 2007 utgjorde bruttoutvalget til undersøkelsen om lag 8 600 personer. Vi oppnådde svar fra i overkant av 6 000 personer (nettoutvalg), noe som tilsvarer en svarprosent på 70,4.
Utvalget til undersøkelsen er trukket som et tilfeldig utvalg og utgjør hvert år et tverrsnitt av populasjonen. I tillegg er utvalget tilrettelagt slik at vi følger de samme personene over flere år, det som kalles en panelundersøkelse. Hver person som trekkes ut til undersøkelsen er i utvalget i åtte år og blir forsøkt intervjuet en gang årlig. Hvert år erstattes 1/8 av utvalget med nye personer, men dette gjøres altså på en slik måte at det totale utvalget til en hver tid representerer et tverrsnitt av befolkingen 16 år og over.
I dette oppdraget er det brukt paneldata basert på utvalget i perioden 2007, 2008 og 2009. Bruttoutvalget for denne perioden besto av nesten 6 100 personer, og vi oppnådde intervju med drøyt 3400 personer i alle tre årene.
Vi registrerer husholdningen til den uttrukne personen, og det er derfor også mulig å lage husholdningsstatistikk på bakgrunn av undersøkelsen. Undersøkelsen gir opplysninger om husholdningers økonomi, også en del om subjektive oppfatninger om økonomien. Den gir også data om bolig, boforhold og boligøkonomi, barnetilsyn, samt opplysninger om arbeid og arbeidssituasjon siste kalenderår (korresponderer med inntektsår). Opplysninger om arbeid samt noe om arbeidssituasjon får vi for alle voksne i husholdningen. Det også noe data om helsesituasjon. Til intervjuundersøkelser knyttes en rekke opplysninger om husholdningens inntekter fra register. I tabellene er det brukt data fra årene 2007, 2008 og 2009, som da dekker inntektsårene 2006, 2007 og 2008.
Utvalgskjevheter og usikkerhet
Levekårsundersøkelsen EU-SILC er en utvalgsundersøkelse, og det er alltid en viss usikkerhet knyttet til resultatene. Utvalget er trukket etter reglene for tilfeldig utvalg og er representativt for den populasjonen undersøkelsen dekker.
I overgangen fra det trukne utvalget (bruttoutvalget) til dem som faktisk blir intervjuet (nettoutvalget) kan det imidlertid oppstå skjevheter i fordelingen etter enkelte kjennemerker. Ved å sammenlikne bruttoutvalget med nettoutvalget etter ulike kjennemerker der vi kjenner fordelingen både i bruttoutvalget og nettoutvalget, kan man si noe om hvor representative dataene er. Når vi kjenner fordelingen av ulike kjennemerker i brutto- og nettoutvalget har vi også mulighet for å rette opp eventuelle skjevheter som har oppstått. Dette kalles frafallsvekting, og i denne oppdraget er frafallsvekter benyttet i alle tabeller og analyser. I levekårsundersøkelsen EU-SILC beregnes det frafallsvekter som korrigerer for skjevheter etter kjønn, alder, utdanning og familiestørrelse. Skjevheter etter kjennemerker hvor vi ikke kjenner fordelingen i begge utvalgene har vi ikke mulighet til å korrigere for.
Fordi resultatene denne rapporten er basert på bygger på opplysninger om et utvalg av den befolkningen som undersøkelsen dekker er det også usikkerhet som følge av utvalgsvarians. I og med at utvalget er trukket etter reglene for tilfeldig utvalg, er det mulig å beregne hvor sto utvalgsvariansen kan ventes å bli. For å måle usikkerheten i resultatet for et kjennemerke kan man benytte standardavviket. Størrelsen på standardavviket avhenger blant annet av tallet på observasjoner i utvalget. For å måle usikkerheten i resultatet for et kjennemerke kan man benytte standardavviket. Gruppene vi studerer i denne rapporten er angitt i tabellen under. Et eksempel kan illustrere usikkerheten knyttet til å analysere såpass små grupper. Hvis vi eksempelvis observerer at 10 prosent av personene som tilhører vanskeligstilte (n=106) har et bestemt kjennetegn, kan vi ved hjelp av standardavviket beregne et konfidensintervall som med en bestemt sannsynlighet inneholder den sanne verdien i populasjonen. Vi finner i tabellen at anslaget på standardavviket til det observerte prosenttallet på 10 er 2,9 hvis antall observasjoner er 584. Formelen for å regne ut konfidensintervallet bruker vi da formelen observert prosentandel +/– (1,96 x standardavvik). Vi får da et konfidensintervall for den sanne verdien som går fra 4,3 til 15,7 prosent. Konfidensintervallene blir smalere dersom antallet observasjoner øker, motsatt blir konfidensintervallet videre dersom den observerte prosentandelen nærmere seg 50.
Ofte er det ønskelig å sammenlikne prosenttall for flere grupper. Når to usikre tall sammenliknes, vil usikkerheten til forskjellen mellom dem vanligvis bli større enn usikkerheten knyttet til hvert enkelt tall. Standardavviket til forskjeller mellom to prosenttall er lik kvadratroten av summen av kvadratene av standardavvikene til enkelttallene. Når en har anslag for standardavviket til slike forskjeller, kan en konstruere konfidensintervall for den sanne verdi på samme måte som beskrevet ovenfor. I praksis betyr dette at forskjellen mellom prosenttall for to grupper er noe større enn det en ren sammenligning av konfidensintervaller skulle tilsi.
I denne rapporten er dette spesielt relevant siden noen av gruppene er små, og antall observasjoner som ligger til grunn for tolkning er lite. Forskjeller mellom grupper vil dermed i stor grad være statistisk usikre.
Vedleggstabell A.1 viser størrelsen på standardavviket for observerte prosentandeler ved ulike utvalgsstørrelser for et utvalg som er trukket etter regler for tilfeldig utvalg. I denne tabellen har vi uthevet ulike grupper som brukes underveis i denne rapporten
Tabell 3.1 Forventet standardavvik for observerte prosentandeler ved ulike utvalgsstørrelser
n: \P: | 5 | 10 | 15 | 20 | 25 | 30 | 35 | 40 | 50 |
---|---|---|---|---|---|---|---|---|---|
25 | 4.4 | 6.1 | 7.3 | 8.2 | 8.8 | 9.4 | 9.7 | 10.0 | 10.2 |
50 | 3.1 | 4.3 | 5.1 | 5.7 | 6.2 | 6.5 | 6.8 | 7.0 | 7.1 |
100 | 2.2 | 3.0 | 3.6 | 4.0 | 4.4 | 4.6 | 4.8 | 4.9 | 5.0 |
106 | 2.1 | 2.9 | 3.5 | 3.9 | 4.2 | 4.5 | 4.7 | 4.8 | 4.9 |
140 | 1.8 | 2.5 | 3.0 | 3.4 | 3.7 | 3.9 | 4.0 | 4.2 | 4.2 |
153 | 1.8 | 2.4 | 2.9 | 3.2 | 3.5 | 3.7 | 3.9 | 4.0 | 4.1 |
168 | 1.7 | 2.3 | 2.8 | 3.1 | 3.4 | 3.5 | 3.7 | 3.8 | 3.9 |
269 | 1.3 | 1.8 | 2.2 | 2.4 | 2.6 | 2.8 | 2.9 | 3.0 | 3.1 |
384 | 1.1 | 1.5 | 1.8 | 2.0 | 2.2 | 2.3 | 2.4 | 2.5 | 2.6 |
2726 | 0.4 | 0.6 | 0.7 | 0.8 | 0.8 | 0.9 | 0.9 | 0.9 | 1.0 |
3323 | 0.4 | 0.5 | 0.6 | 0.7 | 0.8 | 0.8 | 0.8 | 0.8 | 0.9 |
3429 | 0.4 | 0.5 | 0.6 | 0.7 | 0.7 | 0.8 | 0.8 | 0.8 | 0.9 |
4000 | 0.3 | 0.5 | 0.6 | 0.6 | 0.7 | 0.7 | 0.8 | 0.8 | 0.8 |
5000 | 0.3 | 0.4 | 0..5 | 0.6 | 0.6 | 0.6 | 0.7 | 0.7 | 0.7 |