Veiledning for arkivering og publisering av forskningsdata
OsloMet har vedtatt en policy for håndtering og tilgjengeliggjøring av forskningsdata, hvor det heter at forskningsdata skal forvaltes etter prinsippet "så åpent som mulig, så lukket som nødvendig" og følge prinsippene for FAIR datahåndtering (openscience.no).
Arkivering av forskningsdata skjer etter at prosjektet er ferdig, og må ikke forveksles med aktiv lagring av data underveis i prosjektperioden.
Tenk over hvor du deponerer egne data og sørg gjerne for back up hvis du benytter arkiv fra land utenfor EØS.
-
Valg av arkiv
Det fins en rekke arkivtjenester for forskningsdata. Her er noen råd om hvordan du kan velge et passende arkiv for dine data.
Undersøk om det finnes arkiv som brukes innen ditt fagområde internasjonalt. I enkelte tilfeller vil finansiør eller utgiver/forlag kreve at du skal bruke et bestemt arkiv.
-
Undersøk om det finnes arkiv som brukes innen ditt fagområde internasjonalt. I enkelte tilfeller vil finansiør eller utgiver/forlag kreve at du skal bruke et bestemt arkiv.
-
Det kan være hensiktsmessig å velge et arkiv som er etablert på ditt fagområde og som sikrer arkivering av data etter godkjente standarder på fagområdet. Hvis du trenger hjelp med å finne et slikt fagspesifikt arkiv, kan du søke i arkivregisteret re3data (re3data.org).
Norske arkiv
- Som forsker på OsloMet kan du laste opp dataene dine i OsloMet institusjonsarkiv DataverseNO (dataverse.no), som er et nasjonalt, generisk arkiv for åpne forskningsdata. Veiledning til arkivering av forskningsdata i DataverseNO. Forskingsdatakuratorere ved Universitetsbiblioteket ser over og kuraterer forskningsdata før publisering i DataverseNO.
- Data fra spørreundersøkelser og data som omhandler mennesker og samfunn kan du arkivere og publisere i Sikts forskningsdatakatalog/Surveybanken (sikt.no). Sikt kuraterer alle datasett som publiseres i forskningsdatakatalogen/Surveybanken.
- For store data (enkeltfiler større enn 1 TB), anbefaler vi at du bruker NIRD Research Data Archive, Sigma2 (sigma2.no). NIRD kuraterer ikke arkiverte data og forskere må sørge for egenarkivering.
For DataverseNO og Surveybanken får du som OsloMet-forsker hjelp og veiledning til publisering av dataene dine der, gjennom forskningsstøtte ved Universitetsbiblioteket (oslomet.no). For Surveybanken har OsloMet også en databehandleravtale for deling av data med tilgangsbegrensing, som gjør at du slipper å opprette en slik ved arkivering og publisering av prosjektet.
Andre generelle arkiv
- Zenodo er EUs arkiv for forskningsdata (zenodo.org). Her kan du arkivere data og andre dokumenter fra alle fagområder. Zenodo kuraterer ikke arkiverte data og forskere må sørge for egenarkivering.
- Open Science Framework (OSF) er en internasjonal plattform for åpen forskning (osf.io). Her kan du deponere data fra alle forskningsområder. OSF kuraterer ikke arkiverte data og forskere må sørge for egenarkivering.
Videre hjelp til valg av arkiv
For mer informasjon om hvilke kriterier du bør se etter når du velger arkiv, se følgende ressurssider:
-
-
Arkivering av sensitive data og data med personopplysninger
Forskningsdata som inneholder personopplysninger eller som av andre grunner ikke kan publiseres åpent, kan i visse tilfeller deponeres i arkiv som tilbyr tilgangskontroll etter definerte kriterier (jamfør Sikts forskningsdatakatalog, sikt.no).
Anonymiserte data kan i visse tilfeller deponeres i åpent arkiv. Et datasett er anonymisert når data ikke kan spores tilbake til en enkeltperson og koblingsnøkkelen er slettet. Husk at lydopptak av stemmer og videomateriale regnes som personopplysninger i seg selv og skal slettes i henhold til de opplysninger du har gitt deltakerne og Sikts meldeskjema (sikt.no).
Dersom forskningsdata samles inn med informert samtykke, må planer for arkivering etter prosjektslutt inkluderes i samtykkeskjemaene.
-
Dokumentasjon
Dokumentasjon av forskningsdata er beskrivelser av hva du gjør og har gjort med dataene underveis i et prosjekt. God dokumentasjon er med på å styrke kvaliteten på dataene og dine resultater ved å gjøre funnene etterprøvbare.
Dokumentasjon er vanligvis en integrert del av forskningsmetoden og skrives underveis i arbeid med dataene, og oppsummeres og legges ved data som arkiveres.
Dokumentasjon som arkiveres sammen med forskningsdataene kan være:
- ReadMe-fil: et tekstdokument som beskriver innholdet i datasettet ditt skal vanligvis lastes opp sammen med datafilene.
- DataverseNO: ReadMe-filmal (zenodo.org).
- Paradata, ofte i form av et data sheet (dokumentasjon av dataenes tilblivelsesprosess).
- Spørreskjemaet som ble gitt til respondentene.
- Intervjuguide.
- Notater uten personopplysninger eller identifiserende bakgrunnsvariabler.
- Kodebok.
- Kode/script som er brukt, for eksempel som en Jupyter Notebook-fil.
-
Beskrivelse og lisens
Metadata (data om data) gir utfyllende informasjon om datasett som gjør det mulig å for andre å gjenfinne dine forskningsdata, og forstå hvem som har skapt dataene, hvordan de har blitt skapt og hvor de er arkivert. Ved å utarbeide så fullstendige metadata som mulig, legger du til rette for at dataene blir synlige og kan gjenbrukes på en forsvarlig måte. Sitter du på et datasett som ikke kan arkiveres åpent, kan du likevel publisere metadata.
Metadata skal være lesbare for både maskiner og mennesker. Standardiserte metadata er helt sentralt for å gjøre data gjenfinnbare, tilgjengelige, interoperable og gjenbrukbar (FAIR). Ulike arkiv for forskningsdata bruker ulike og noe tilpassede metadatastandarder.
Valget av arkiv vil derfor oftest legge føringer for hvilke metadatastandarder du skal anvende. Oversikt over metadatastandarder (alliance.github.ui).
God organisering og ryddig filstruktur er viktig for etterprøvbarhet og gjenfinning. Vi anbefaler at du benytter arkivvennlig filformat og en hierarkisk mappestruktur med deskriptive og/eller logiske og konsekvente navn på mapper og filer. Du kan lese mer om organisering av forskningsdata i deponeringsguiden til DataverseNO (uit.no).
Publiserte datasettet skal ha en lisens som bestemmer vilkår for gjenbruk og regulerer hva andre har lov til å gjøre med datasettet ditt. Mange arkiv har egne retningslinjer for valg av lisens, men det anbefales at du velger en standardlisens. Informasjon om lisenser (openscience.no).
-
Støtte og opplæring
Du kan få hjelp til å velge arkiv og støtte til arkivering ved å kontakte Universitetsbiblioteket, seksjon for forskningsstøtte (e-post).