Status for bruk av åpne data
Generelle betraktninger
Vi har lite kunnskap om bruken av åpne kulturdata. Det finnes foreløpig ingen statistikk som viser bruken av APIene, og det er ikke gjort brukerundersøkelser som kan si noe om hvem som bruker hvilke data til hva. Ingen av etatene har implementert løsninger for logging av bruken av de åpne APIene. Basert på den begrensede informasjonen man har er det grunn til å anta at det er relativt lite bruk av åpne kulturdata, spesielt i form av nye tjenester fra tredjepart.
Erfaringen viser også at det er nødvendig med tiltak for å øke kjennskapen til og bruken av åpne kulturdata.
Direkte tilgjengeliggjøring vs. aggregatorer/data.norge.no
Kulturdata er tilgjengelige gjennom API-er, web-tjenester, filer for nedlasting, bruk av åpne formater, etc. Institusjonene har i varierende grad valgt å bruke fellestjenester som data.norge.no og Norvegiana for dokumentasjon og tilgjengeliggjøring. Det er også noe varierende hvordan datasett og tjenester er dokumentert på institusjonenes egne nettsider.
Tabellen under illustrerer dette.
Datasett | Institusjon | Dokumentasjon på institusjonens egen nettside | Dokumentasjon på data.norge.no | Tilgjengelig i Norvegiana |
---|---|---|---|---|
Arkivportalen | Stiftelsen ASTA | Nei | Nei | Ja |
Folketellingen 1910 | Arkivverket | Nei | Ja | Ja |
NBdigital | Nasjonalbiblioteket | Ja | Nei | Nei |
Bokhylla | Nasjonalbiblioteket | Ja | Nei | Nei |
Digitalt Museum | KulturIT | Nei | Ja | Ja |
Bruk av åpne samlingsdata
Digitalarkivet (Arkivverket) og Bokhylla (Nasjonalbiblioteket) er sektorens mest brukte webtjenester i dag. Populære data i Digitalarkivet er folketellinger, kirkebøker, adressebøker og andre «slektsgranskningrelaterte» data. Av disse er det kun folketellingen fra 1910 som er tilgjengelig som åpne data på data.norge.no. Det finnes ingen statistikk for bruken av denne.
Bokhylla.no vil innen 2017 inneholde omlag 250 000 bøker som er utgitt i Norge til og med år 2000. Teksten er indeksert og søkbar. Dataene er derimot ikke maskinlesbare, og er kun tilgjengelige for norske IP-adresser. Bokhylla er dermed ikke å anse som åpne data. Begrensningene for det rettighetsbeskyttede materialet dikteres av avtalen Nasjonalbiblioteket har gjort med rettighetshaverne.
Bruk av åpne forvaltningsdata
Museumsstatistikken er et eksempel på forvaltningsdata som brukes i økende grad. I tillegg til at statistikken brukes av forvaltningen selv, publiserer Statistisk sentralbyrå museumsstatistikk og bruker tallene videre i sin egen presentasjon av kulturstatistikken. Det private forskningsinstituttet Telemarksforsking er også i gang med å lage en database over museumstatistikken, basert på rådata levert fra Norsk kulturråd. Rådgivningsselskapet Rambøll utarbeider en oversikt over visuell kunst i tall og bruker tall fra museumsstatistikken som en del av bakgrunnsmaterialet.
Nasjonalbiblioteket har ansvar for å samle og presentere den norske bibliotekstatistikken. Her finnes et åpent datasett som viser årlig bestand, tilvekst og bruk av alle fag- og forskningsbibliotek, folke- og fylkesbibliotek i Norge.
Arkivverket, Nasjonalbiblioteket og Norsk kulturråd samler og publiserer statistikkene på henholdsvis arkiv-, bibliotek- og museumsfeltet. De tre statistikkene overlapper til en viss grad på hvilke institusjoner som leverer tall. De har også berøringspunkter der typene materiale i samlingene overlapper. Det er etablert en møteplass for koordinering av spørreskjema, utveksling av erfaringer og diskusjon av arbeidet. Statistiske data fra de tre sektorene bør kunne publiseres som åpne data, og gjerne også med lenking av institusjoner, geografi, material- og samlingstyper.
Hvilke data er etterspurt men ikke tilgjengelige i dag?
Data fra Norsk kulturråds søknadsforvaltning er etterspurt både fra media, forvaltning og forskning (evaluerings- og utredningsprosjekter). Det finnes ingen statistikk over denne etterspørselen, men den oppfattes som relativt stabil de siste årene. Det vanligste er forespørsler om en konkret region eller kategori, og da om hvem som har søkt, hva de har søkt om (både prosjekt og sum) og om de har fått tilskudd eller ikke. Slike data må i dag i stor grad hentes ut og tilgjengeliggjøres manuelt på forespørsel.
Det er generelt stor etterspørsel etter diverse samlingsinnhold i Arkivverket, Nasjonalbiblioteket og museene som ikke er digitalisert eller digitalt tilgjengeliggjort. Eksempler på populære materialtyper er aviser, tidsskrifter, kart, tegninger og foto. Noe av dette materialet, primært aviser og tidsskrifter, er ikke tilgjengeliggjort grunnet komplekse og uavklarte rettighets- og avtaleforhold.
All tekst som digitaliseres i Nasjonalbiblioteket OCR-behandles18. Denne tekstgjenkjenningen gjør det mulig å søke på ord og fraser i en scannet bok, en avis eller et tidsskrift. OCR-teksten er dessuten etterspurt av brukere med synshemming eller lesevansker, fordi den kan brukes på leselist og til å generere syntetisk tale. Slike løsninger støter imidlertid på en del utfordringer. Kvaliteten på OCR-teksten bestemmer leseopplevelsen, og materiale som er dekket av avtaler med rettighetshavere er ikke uten videre nedlastbart.
Har tilgjengeliggjøringen gitt nye tjenester?
Tilgjengeliggjøringen av åpne kulturdata har så langt gitt flere nye tjenester. Tjenestene er utviklet gjennom intern bruk av APIer (Digitalarkivet på mobil og Historisk befolkningsregister i Arkivverket), gjennom samarbeidsprosjekter som Kultur- og naturreise eller på direkte initiativ fra eksterne interessenter. De viktigste kjente brukerne, dvs. løsningene/tjenestene som bruker åpne kulturdata frermgår av tabellen nedenfor:
Tjeneste / løsning | Tema | Utvikler | Data som inngår |
---|---|---|---|
Innsyn; søke i flere samlinger | Webløft; Buskerud fylkesbibliotek | Norvegiana, NBdigital, folkebibliotekkataloger m.m. | |
Innsyn; søke i flere samlinger | Regionale kulturnett | Norvegiana | |
Mobilapplikasjon; innsyn; søke i flere samlinger | Avinet | Norvegiana, FT 1910 | |
Innsyn; søke i flere samlinger | Trondheim kommune, byplankontoret | Norvegiana | |
Mobil og nett. Kartvisning av innhold fra flere kilder | Kultur- og naturreise-prosjektet | Norvegiana, og flere andre kilder | |
Mobilapplikasjon | Kultur- og naturreise-prosjektet | Norvegiana, og flere andre kilder | |
Mobilapplikasjon; opplevelser langs Rallervegen | Hordaland fylkeskommune | Norvegiana | |
Mobilapplikasjon; opplevelser i “Prøysenland” | Hedmark fylkesbibliotek | Norvegiana | |
Mobilapplikasjon | Privat utvikler | Folketelling 1910 og Norvegiana | |
Mobilapplikasjon | Prosjektet TAG CLOUD/Sintef | Norvegiana | |
Nett og mobil | Riksantikvaren | Norvegiana | |
Mobilapplikasjon | Privat utvikler | DigitaltMuseum | |
Søk i museets samlinger | Nasjonalmuseet | DigitaltMuseum | |
Mobilapplikasjon | Riksarkivet | Digitalarkivet | |
Lenkegenerator | NBdigital |
Detaljert oversikt og mer informasjon om de enkelte løsningene som bruker data fra Norvegiana er publisert på https://norvegianablog.wordpress.com/losninger-som-bruker-norvegiana-data/.
Den generelle erfaringen er at tilgjengeliggjøring og bruk påvirker datakvaliteten positivt gjennom brukerkommentarer på feil og nødvendige forbedringer. Gitt at disse blir fulgt opp vil datakvaliteten bli bedre. Nasjonalbiblioteket har som mål å ta i bruk egne APIer internt, bl.a. for å selv kunne finne og rette feil i egne data og dermed heve datakvaliteten raskere.