Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata

Til innholdsfortegnelse

5 Offentlige data som er viktige datakilder for forskning

5.1 Bedre tilrettelegging for bruk av offentlige data til forskning

Statens arbeid med å digitalisere offentlig sektor og legge til rette for videre bruk av offentlige data foregår primært gjennom regjeringens arbeid med oppfølging av Meld. St. 27 (2015–2016) Digital agenda for Norge – IKT for en enklere hverdag og økt produktivitet.

I meldingen gjør regjeringen det klart at den ønsker å styrke arbeidet med å gjøre offentlige data tilgjengelig for viderebruk og gjenbruk. Tiltak i meldingen omfatter blant annet at det, i tillegg til bedre tilrettelegging for gjenbruk av forskningsdata, skal utarbeides strategier og handlingsplaner for økt tilgjengeliggjøring av data innenfor områdene kultur, geodata, statlige utgifter og transport. Økt tilgjengelighet av offentlige data vil bidra til å styrke forskningen, gjennom enklere og raskere tilgang til datasett for forskere. Lett tilgjengelige offentlige data kan også ha stor verdi for høyere utdanning, for eksempel som grunnlag for masteroppgaver. Kulturdepartementets strategi for åpne data ble lansert i oktober 2017.33 For de øvrige områdene pågår det arbeid med utarbeiding av strategier eller handlingsplaner.

I noen tilfeller kan det være flytende over­ganger mellom forskningsdata og forvaltningsdata (eks. klima- og miljøovervåkningsdata), og det er ingen tvil om at offentlige data som er samlet inn for andre formål utgjør viktige datakilder for forskning. Mange forskningsspørsmål krever at man kobler opplysninger fra flere ulike datakilder. Disse prosessene bør skje så effektivt som mulig. Ikke bare for å unngå sløsing med ressurser, men også fordi mye av den aktuelle forskningen skal ha konkrete anvendelser som krever at kunnskapen blir produsert i tide for å være til nytte. Det bør utarbeides felles regler, standarder og formater på data og gode metadata der det er naturlig. Arbeidet bør skje i nært samarbeid med sentrale brukergrupper. For at forskere skal kunne planlegge sine prosjekter både med hensyn til forskningsdesign, tidsplaner og budsjetter, er det viktig med åpenhet og forutsigbarhet om vilkårene for tilgang, datakvalitet, og tidsbruk og kostnader for datatilgang. Derfor er det viktig at offentlige data tilrettelegges godt for videre bruk, slik at også forskningen kan dra nytte av dem.

Generelt er det slik at en del offentlige data allerede er åpent tilgjengelig for alle aktører. Det varierer imidlertid hvor godt de er tilrettelagt for gjenbruk. At data som er samlet inn for andre formål, tilrettelegges godt slik at de også er enkle å bruke som grunnlag for forskning, kan være et viktig bidrag til å øke kvaliteten og relevansen i forskningen. God tilrettelegging for gjenbruk på en måte som også tjener forskningen, kan derfor anses som en viktig del av departementenes sektor­ansvar for forskning.

Nasjonale tjenester for åpne offentlig data

Det finnes flere nasjonale tjenester for åpne data fra det offentlige. Data.norge.no er den nasjonale katalogen over datasett som er gjort tilgjengelig for viderebruk. Formålet med portalen er å gjøre det enklere å oppdage, vurdere og eventuelt bruke åpne data fra det offentlige til nye formål. Portalen inneholder kun beskrivelser av datasettene, med pekere til hvor datasettene finnes. Data.norge.no støtter den europeiske standarden for utveksling av datasettbeskrivelser (DCAT-AP) og gjør alt innhold i selve datakatalogen tilgjengelig for den europeiske åpne data-portalen https://www.europeandataportal.eu/. Både Digitaliseringsrundskrivet og Regjeringens retningslinjer for tilgjengeliggjøring av offentlige data legger opp til at offentlige virksomheter skal synliggjøre sine åpne data gjennom data.norge.no.

Datahotellet er en gratis datadistribusjons­tjeneste fra Difi hvor dataeiere kan gjøre egne datasett tilgjengelig for bruk uten å måtte gjøre investeringer i egen infrastruktur eller programvare. For brukere betyr dette at data som tidligere kun har vært tilgjengelig for nedlasting som regneark (eller ikke tilgjengelig i det hele tatt), blir gjort tilgjengelig gjennom et standardisert programmeringsgrensesnitt (API) som leverer data i flere populære maskinlesbare formater. Alle datasett på datahotellet skal være registrert på data.norge.no og søk og navigering skjer også via data.norge.no.

Regjeringen vil

  • be offentlige aktører legge til rette for gjenbruk av data til forskning, innovasjon og verdiskaping ved oppgradering og utvikling av systemer for datalagring
  • legge vekt på tilgang til data for forskning i arbeid med relevante lov- eller forskriftsendringer

5.2 Bedre samspill mellom offentlige data og forskningsdata

I OECDs gjennomgang av digitaliseringen av offentlig sektor i Norge pekes det på at systemet er for fragmentert. Det utvikles sektorinterne løsninger uten at det i tilstrekkelig grad tas hensyn til om bedre løsninger allerede er utviklet andre steder eller til behovet for at egen løsning bør fungere sammen med andres løsninger. Denne fragmenteringen gjør at Norge ikke lykkes med å løse systemiske forvaltningsutfordringer på tvers av sektorgrenser.34

I OECDs landgjennomgang av det norske forskningssystemet beskrives Norge som gode med hensyn til inkrementelle forbedringer og innovasjoner innenfor enkeltområder, men det pekes på at systemer og verktøy for å skalere opp og spre videre vellykkede tiltak og initiativer mangler, spesielt i offentlig sektor. Større og mer omgripende endringer vil kanskje kreve andre verktøy og måter å organisere seg på. Direktoratet for IKT og forvaltning får kritikk for å fokusere for ensidig på digitalisering og overse andre faktorer som påvirker innovasjon i offentlig sektor (som organisering, reguleringer, eksperimentering og læring osv.). Mange av samfunnsutfordringene overskrider sektorgrenser og trenger en tverrfaglig tilnærming og bedre horisontal koordinering på myndighetsnivå for å løses.35

For å motvirke fragmenteringen og bidra til at data som samles inn for offentlige midler skal være til best nytte for samfunnet, er det behov for en møteplass der man kan samle særlig relevante aktører fra forskning og forvaltning som har data som er relevante for svært mange. Det er behov for bedre koordinerte råd om (i) fornuftig samordning og harmonisering av faglige og IKT-tekniske løsninger på tvers av sektorer, (ii) om datakvalitet, tilgangsstyring, rutiner med mer, samt (iii) om hensiktsmessige finansieringsmodeller for datainfrastrukturer av nasjonal betydning som skal betjene både forskere, forvaltere, næringsliv og innbyggere.

Regjeringen ser behov for et nasjonalt forum for gjenbruk av forskningsdata, med representasjon fra relevante offentlige organer som eier eller er ansvarlige for forskningsdatainfrastrukturer eller datainfrastrukturer og samlinger opprettet for forvaltningsformål som er særlig relevante for forskere. Aktuelle deltakere kan for eksempel være Norsk senter for forskningsdata, Uninett, Helsenett, Direktoratet for e-helse, Norges forskningsråd, Statistisk sentralbyrå, Datatilsynet, Direktoratet for forvaltning og IKT, Riksarkivet og Nasjonalbiblioteket. Før det nye organet for høyere utdannings- og forskningstjenester er kommet på plass og sammensetningen av organets overordnede strategiske råd er kjent, er det vanskelig å konkludere endelig om hvordan behovet for et nasjonalt forum for gjenbruk av forskningsdata mest hensiktsmessig kan ivaretas. Kunnskapsdepartementet vil følge opp behovet for et slikt forum i samarbeid med det nye organet for høyere utdannings- og forskningstjenester og sentrale interessenter.

Regjeringen vil

  • vurdere å etablere et nasjonalt forum for gjenbruk av forskningsdata med representasjon fra relevante offentlige organer for å få råd i spørsmål om samordning, datakvalitet, tilgangsstyring, rutiner og finansiering av nasjonale datainfrastrukturer som skal betjene både forskere, forvaltere, næringsliv og innbyggere

5.3 Enklere tilgang til data fra Statistisk sentralbyrå for forskningsformål

Data som er verdifulle for produksjon av statistikk, er også gjerne verdifulle for forskning. Statistikk­loven fastsetter at en av Statistisk sentralbyrås (SSBs) oppgaver er å gi opplysninger til statistisk bruk for forskningsformål, innenfor rammene av blant annet personvernet og statistisk konfidensialitet. SSBs data er viktige kilder i en rekke typer forskning i Norge (samfunnsvitenskapelig og humanistisk forskning, helseforskning osv.). Selv om bruken av slike data allerede utgjør en stor verdi for norsk forskning i dag, er det muligheter for flere forbedringer for å kunne utnytte potensialet på en best mulig måte. Mulige forbedringer er særlig knyttet til å gjøre prosessene for datatilgang mer forutsigbare og effektive.

En rekke forskningsinstitusjoner har pekt på utfordringer med å få utlevert mikrodata fra registrene til SSB. Vilkårene for tilgang virker uoversiktlige, rollefordelingen mellom ulike instanser i godkjenningsprosessen oppleves som uklar, det er høyere tidsbruk og kostnader for utlevering enn forskerne mener burde forventes, og utleveringsprosedyrene oppleves som lite tilpasset behovet for å  gjenbruke data.36

SSBs data inkluderer både opplysninger SSB har innhentet for statistisk bruk direkte fra privatpersoner og foretak til å lage statistikk, og opplysninger fra forvaltningens administrative datasystemer (registerdata). Begge typer er data som i grunnregelen ikke kan deles åpent når de er innhentet for behandling til statistiske formål. Data som SSB innhenter i første hånd, forutsetter i mange tilfeller konfidensialitet. Dersom det oppstår usikkerhet om hvordan opplysningene blir håndtert i etterkant, kan det føre til at personer eller bedrifter unnlater å svare på spørsmål eller gir uriktige opplysninger, og dataene vil kunne bli av dårligere kvalitet. Det kan imidlertid være mulig å levere ut opplysninger dersom det på forhånd er innhentet samtykke. Registerdata inneholder ofte sensitive opplysninger, og tilgang til disse er som regel strengt regulert. I henhold til statistikkloven skal datagrunnlaget for offisiell statistikk gjøres tilgjengelig for forskning. Mottaker er ansvarlig for å behandle opplysningene i henhold til statistikklovens taushetsplikt og annet regelverk for behandling av personopplysninger. God informasjonssikkerhet og godt personvern er avgjørende for befolkningens tillit til forvaltningen og aksept for at det utvikles omfattende registre.

For registerdata vil det ofte være mulig å få adgang til opplysningene direkte fra etaten som forvalter det aktuelle registeret i den grad reguleringene åpner for at opplysningene kan brukes til forskning. Forskere finner det likevel ofte mest hensiktsmessig å hente opplysningene fra SSB, for eksempel fordi man skal ha opplysninger fra flere registre på en gang, samt SSBs kvalitetssikring av registerdataene. Kvalitetssikringen som gjøres av SSB, er av stor verdi, og det er lite effektivt at denne gjøres flere steder.

For å effektivisere håndtering av mikrodataoppdrag reorganiserte SSB dette arbeidet i 2013 i en egen seksjon for utlån av mikrodata. Samtidig endret de prismodellen for oppdragene, og fra 2014 av har merkostnader ved utlevering blitt fakturert oppdragsgiver fullt ut. Tabell 5.1 viser noen nøkkeltall for mikrodataoppdragene i SSB de seneste årene.

Mikrodataoppdrag i SSB

2012

2013

2014

2015

2016

Oppdrag levert

176

158

267

220

238

Oppdrag under behandling 31.12.

..

> 250

75

79

100

Besvarte henvendelser/veiledning

..

191

270

386

436

Totalt utfakturert, mill. kr

2,4

8

12,5

10,4

12,5

Laveste/høyste pris, 1000 kr

2–300

2–600

2–336

2–661

2–630

Gjennomsnittspris, 1000 kr

14,2

61

57

42,1

52

Tallene gjelder utlån fra seksjon for mikrodata. Noen få oppdrag håndteres fremdeles i andre deler av SSB. Besvarte henvendelser/veiledning er antallet som er gitt rundt ufullstendige søknader/bestillinger. Oppdrag under behandling for 2013 er antallet på det meste i løpet av året, ikke per 31.12.

Kilde: Statistisk sentralbyrås årsrapporter for 2016 og 2014

Effektive prosesser for utleveringsoppdrag stiller krav både til oppdragsgiverne og til SSB. I tillegg til prosessene for å forbedre sin interne oppgaveløsning som har gjort det mulig å behandle flere oppdrag enn tidligere, har SSB også lagt vekt på å forbedre veiledning og informasjon for at forskere skal kunne utarbeide fullstendige søknader av god kvalitet. SSB har også blitt enige med registereierne og Datatilsynet om en forenkling i prosedyrene for dispensasjoner fra taushetsplikten etter forvaltningsloven, og fra oktober 2015 har forskere kunnet søke dispensasjon direkte fra SSB for data som brukes til statistikk, der de tidligere måtte søke enkeltvis til de ulike eierne av registrene dataene er hentet fra.

I perioden 2012–2017 har Norsk senter for forskningsdata (NSD) og SSB samarbeidet om prosjektet RAIRD (Remote Access Infrastructure for Register Data), som er støttet av Forskningsrådets infrastruktursatsing. Prosjektet utvikler en teknisk løsning for å forbedre tilgangen til registerdata for forskningsformål. Løsningen vil muliggjøre statistiske analyser av mikrodata uten å gi tilgang til selve dataene, og inneha ulike sperrer for at analysene kan resultere i identifiserbare opplysninger. Løsningen vil dermed gjøre det mulig å forske på administrative mikrodata uten behandlingsgrunnlag, og med betydelig enklere prosedyrer for godkjenning. Denne muligheten vil ikke fullt ut erstatte behovet for også å utlevere selve mikrodata til forskning. Det vil likevel trolig være et aktuelt alternativ for noen av dem som søker om slike data i dag, noe som kan gi mer ressurser til å håndtere de oppdragene der denne løsningen ikke strekker til.

Overgangen til en prismodell der forskningsprosjektene må fullfinansiere SSBs merkostnader ved datautleveringen, førte til en prisøkning fra tidligere praksis der SSB delfinansierte dette fra sin egen driftsbevilgning. At kostnadene synliggjøres og belastes forskerne, kan bidra til økt effektivitet ved at man bedre avveier kostnadene mot nytten før man søker, og ved at søknader utformes med høyere kvalitet. Samtidig skaper høyere priser utfordringer, særlig når prisene er vanskelige for forskere å beregne på forhånd, noe som gjør det vanskelig å planlegge budsjetter for prosjektsøknader eller tilbud i oppdragskonkurranser. Prisene kan også skape utfordringer for typer av forskning der oppdragsmarkedet og muligheter for tilskudd er små. Statistikklovutvalget, som ble nedsatt i september 2016 og skal avgi rapport innen 15. mars 2018, skal blant annet vurdere prinsipper for oppdragsvirksomheten til SSB og deres prising av eksterne oppdrag, blant annet til forskning.

Regjeringen forventer

  • at forskningsinstitusjonene bidrar til bedre bestiller­kompetanse hos egne forskere og støtte­personell

Regjeringen vil

  • utrede en finansieringsmodell for tilgang til data fra Statistisk sentralbyrå til forskning som ivaretar både hensynet til en effektiv bruk av ressurser på datatilgangen og samfunnsmessige gevinster av forskningen
  • støtte opplæringstiltak for forskere og støttepersonell i regi av Statistisk sentralbyrå
  • vurdere forslag fra Statistikklovutvalget og innspill fra høringen med sikte på å bedre forskeres tilgang til data fra Statistisk sentralbyrå

5.4 Enklere og sikrere tilgang til helsedata

Norge har et internasjonalt fortrinn i og med det kunnskapsgrunnlaget som er samlet gjennom helseregistre, biobanker og befolkningsundersøkelser og andre data som regelmessig frembringes gjennom helsetjenestene. Det er bakgrunnen for at lettere tilgang til og økt utnyttelse av helsedata er ett av fem prioriterte områder i HelseOmsorg21-­strategien. Regjeringen har fulgt opp med tiltak for å gjøre helsedata lettere tilgjengelig for forskning og andre formål i handlingsplanen for oppfølging av HelseOmsorg21-strategien. Målet er å sikre at de store investeringene i helseregistre, biobanker og befolkningsundersøkelser blir brukt til å utvikle ny kunnskap og bedre tjenester. Dette kan og skal skje innenfor personvernmessig trygge rammer.

I dagens system kan det være ressurs- og tidkrevende å få tilgang til helsedata. Særlig kan det være utfordrende når det er behov for kobling av data fra flere kilder og når data skal brukes til forskningsprosjekter med en mer eksplorativ tilnærming. Utfordringene er blant annet beskrevet i Forskningsrådets rapport Enklere tilgang – mer forskning fra desember 2016 og i Helsedatautvalgets rapport Et nytt system for enklere og sikrere tilgang til helsedata fra juni 2017.

Forskningsrådets rapport viser til at det er bred enighet om at det er for tungvint og tar for lang tid å få tilgang til koblede registerdata for forskningsformål. Videre heter det at kartleggingen som er gjennomført i sammenheng med rapporten sannsynliggjør at dette medfører mindre norsk helseforskning. Det vises til at andre nordiske land over tid har etablert nasjonale infrastrukturer og fellesløsninger for helseanalyse, tilgjengeliggjøring av data og forskning som setter dem bedre i stand til å utnytte helsedata enn i Norge.

Helsedatautvalget peker på en rekke utfordringer knyttet til organisering, rettslig regulering og dagens godkjenningssystem som bidrar til lang saksbehandlingstid, kompleksitet og inkonsistente avgjørelser. Videre mener utvalget at statistikk­loven og SSBs praksis gjør at muligheten for å få sammenstilt demografiske og sosioøkonomiske data med helsedata til forskningsformål er tungvint. Utvalget konkluderer med at det er for komplisert og tidkrevende å få utlevert helsedata til sekundærbruk og viser til at disse utfordringene har vært grundig diskutert og dokumentert i en årrekke.

Helsedatautvalgets konklusjoner

Helsedatautvalget ble nedsatt av Helse- og omsorgsdepartementet i 2016 for å utrede et bedre og mer effektivt system for behandling av helsedata for statistikk, planlegging, helseanalyser, kvalitetsforbedring og forskning, innovasjon og næringsutvikling. Utvalget overleverte sin rapport til Helse- og omsorgsdepartementet i juni 2017.

Et samlet utvalg mener at pågående tiltak for å gjøre tilgangen til helsedata enklere og sikrere må gjennomføres så raskt som mulig. Utvalget mener imidlertid at tiltakene ikke er tilstrekkelige til å løse de grunnleggende utfordringene. Utvalgets flertall anbefaler derfor at det innføres et nytt system for tilgang til helsedata som innebærer at:

  • dagens krav om forhåndsgodkjenning fra Datatilsynet og/eller de regionale komiteene for medisinsk og helsefaglig forskningsetikk avvikles
  • det etableres en nasjonal tjeneste som ivaretar alle forvaltningsoppgaver for å tilgjengeliggjøre helsedata
  • en første versjon av en helseanalyseplattform realiseres raskt og bygges ut over tid under et strengt kvalitetsgodkjennings- og informasjonssikkerhetsregime
  • demografiske og sosioøkonomiske data på individnivå gjøres tilgjengelig på en helseanalyseplattform, enten fra Statistisk sentralbyrå eller fra andre kilder.
  • Utvalgets mindretall mener at mulige handlingsalternativer og konsekvensene av tiltakene ikke er tilstrekkelig utredet. Etter mindretallets vurdering er det derfor ikke grunnlag for å konkludere med at tiltakene bør gjennomføres. Dette gjelder særlig pkt. 2 og 3.

Rapporten ble sendt på høring 1. september (frist 1. desember) for å sikre forankring og innspill fra en større bredde av aktører før departementet tar stilling til videre oppfølging.

Det pågår et viktig arbeid gjennom Helsedataprogrammet som Direktoratet for e-helse i 2017 fikk ansvar for å etablere og følge opp. Helsedataprogrammet skal både bidra til å gjøre helsedata lettere tilgjengelig for forskning og annen sekundærbruk og til bedre personvern og informasjonssikkerhet. Direktoratet skal, i regi av Helsedataprogrammet, utvikle en rekke fellestjenester for helseregistrene som vil gjøre bruken av helsedata enklere, for eksempel en tjeneste for å etterspørre samtykke og en oppslagstjeneste for kodeverk, metadata, og registervariabler. Det vil bli etablert en nasjonal løsning for publisering av kodeverk, terminologi og metadata, med hovedvekt på sekundærbruk av data til forskning og kvalitetsarbeid.

En sentral oppgave i Helsedataprogrammet er å etablere en plattform for tilgjengeliggjøring og analyse av helsedata (helseanalyseplattformen). Formålet er å forenkle og effektivisere tilgangen til helsedata. Forskningsrådet og Direktoratet for e-helse inngikk i mars 2017 en samarbeidsavtale om å utvikle helseanalyseplattformen til beste for forskning. I tillegg samarbeider en lang rekke aktører om å finne gode løsninger for en slik plattform gjennom Helsedataprogrammet.

Regjeringen forventer

  • at databehandlingsansvarlige for helseregistre og Statistisk sentralbyrå gjennom Helsedataprogrammet bidrar til at data i større grad skal kunne analyseres sikkert og effektivt på tvers av datakilder

Regjeringen vil

  • vurdere forslagene fra Helsedatautvalget og innspill fra høringen med sikte på å etablere et enklere og sikrere system for tilgang til helsedata
  • vurdere etablering av en plattform for helse­analyser, jf. oppdrag til Direktoratet for e-helse om å utrede etablering av en slik plattform

Fotnoter

33.

https://www.regjeringen.no/no/dokumenter/kulturdepartementets-strategi-for-apne-data/id2576038

34.

https://www.oecd.org/gov/digital-government/digital-government-review-norway-recommendations.pdf

35.

OECD Reviews of Innovation Policy: Norway 2017

36.

Se f.eks. felles innspill til Statistikklovutvalget fra Universitets- og høgskolerådet og Forskningsinstituttenes fellesarena: https://www.abelia.no/contentassets/d02b8111abb04dff89fcdd863ee25b6a/innspill-til-­statistikklovutvalget-17-08-17.pdf
Til forsiden