Lagring av forskningsdata - Ansatt

Forskningsdata

Forskningsdata

Her finner du informasjon om håndtering av forskningsdata gjennom forskningslivssyklusen – fra planlegging, innsamling og lagring til behandling, ferdigstillelse, arkivering og gjenbruk.

Transparens, etterprøvbarhet og mulighet for gjenbruk er viktige forskningsetiske prinsipper som særlig gjør seg gjeldende for forskningsdata. I henhold til OsloMets forskningsdatapolicy, skal forskningsdata håndteres i samsvar med prinsippene om FAIR-datahåndtering og i all hovedsak deponeres i et arkiv som legger til rette for tilgjengliggjøring.

Student med spørsmål om forskningsdata? Se informasjon på siden Lagre og behandle data i studentoppgaver (student.oslomet.no).

  • Planlegging

    • Personopplysninger. I likhet med den øvrige forskningsprosessen er det viktig at du tidlig planlegger for forskningsdataenes livsløp. Skal du behandle personopplysninger i ditt forskningsprosjekt? Da må du fylle ut og sende inn meldeskjema til Sikt (sikt.no), samt huske på at medisinske og helsefaglige prosjekter krever forhåndsgodkjennelse fra Regionale komiteer for medisinsk og helsefaglig etikk (REK). På personvern- og informasjonssikkerhetssidene til OsloMet finner du det meste om hvordan bruke og  behandle personopplysninger i forskning.
    • Klassifisering av data. Det er viktig at du setter deg inn i hvilke klassifisering dine forskningsdata vil ha da dette sier noe om hvilke beskyttelse dine data trenger, og på hvilke IKT-system som du kan lagre og behandle dine data (Lagringsguiden).
    • Datahåndteringsplaner. En datahåndteringsplan beskriver hvordan forskningsdataene håndteres underveis i et prosjekt og hvor åpent de kan deles etter publisering og etter at prosjektet er ferdig. Dette er et nyttig verktøy som bidrar til å strukturere og effektivisere arbeidsflyten og sikrer kvaliteten på datahåndteringen gjennom hele forskningsprosessen. Mer om hvorfor og hvordan man skriver en datahåndteringsplan har vi samlet mer informasjon om på egen nettside om datahåndteringsplaner.
    • Sikre lagringsområder. Trenger du et sikkert lagringsområde må dette planlegges i forkant da de fleste krever en søknad. Hvilke lagringsløsninger OsloMet tilbyr og egenskaper ved disse finnes innunder lagringsguiden og lagring i forskning
    • Samarbeid om forsking. Samarbeid med andre er et større tema som er dekket opp under avtaler og andre juridiske temaer, men nevnes her slik at kan planlegge for om du trenger en avtale og hva slags avtale du kan trenge for bruk av forskningsdata. Se egene avtalemaler som gjelder for bruk av persondata. 
    • Finn tidligere relevant forskning og forskningsdata (for gjenbruk). Et naturlig ledd i forarbeidet til en forskningsprosess er å kartlegge tidligere forskning på emnet som skal utforskes. Det er også tilfeller der det gir mening å gjenbruke allerede eksisterende data. Det fins en rekke løsninger for å finne frem til eksisterende forskningsdata som kan gjenbrukes og videreutvikles i nye forskningsprosjekter. På denne nettsiden har vi samlet hvilke arkivløsninger som finnes, som kan være et godt sted å starte, samt at du på en egen side også kan finne informasjon om fagspesifikke arkiv for langtidslagring.

     

  • Gjennomføring

    • Strukturering av dine forskningsdata. Hvordan data samles inn, organiseres, dokumenters og sikres, har betydning både for kvaliteten og sikkerheten på din forskning, men også for at du og andre skal ha mulighet for å forså datamaterialet i fremtiden. Grunnlaget for dette bør ligge i en god datahåndteringsplan, slik at du også underveis i prosjektet sørger for å oppdatere denne på hvordan dataene håndteres og organiseres, eksempelvis med mapper, filnavn, versjoner, formater, tilganger og eventuelle forklaringsfiler (ReadMe).

    Innsamling av forskningsdata

    Ulike fagfelt har ulike datakilder eller foretrukne metoder å samle inn data på. Det finnes i tillegg en mengde ulike verktøy og metoder for å samle inn ulike typer data fra ulike datakilder. Under er en liste over verktøy OsloMet tilbyr for innsamling og hvilken type data det er egnet for:

    Behandling og analyse av forskningsdata

    • Transkribering. Dersom du har lydfiler som du trenger å transkribere, finner du en oversikt over anbefalte verktøy og nyttige råd her.
    • Verktøy for analyse. Ulike fagfelt har ulike verktøy og foretrukne metoder for å behandle og analysere forskningsdata. For en oversikt over de verktøyene som OsloMet tilbyr lisens på, må du gå til SoftwareCenter/Programvaresenteret som du finner i menyen på din egen OsloMet-laptop.  For enkelte programvare tilbys forskningsstøtte og kurs. 
    • Fysiske forskningsdata. Se OsloMets egen nettside for rutiner dersom du har fysiske forskningsdata (ikke-digitale forskningsdata), men data i form av fysiske prøver eller forskningsdata på papir.
  • Avslutning

    Etter prosjektslutt skal forskningsdata arkiveres på forsvarlig vis, og, dersom det er mulig, deles åpent. Prosjekter skal også avsluttes der de har blitt opprettet hvis de bruker teknisk infrastruktur som TSD, EduCloud, Mime o.l.

    Hovedprinsippet for vurdering av hvordan forskningsdata skal bevares for ettertiden er at de skal være Så åpne som mulig — Så lukkede som nødvendig. Naturlige vurderinger er: 

    • Hva kan deles åpent?
    • Hva kan deles med begrenset tilgang? 
    • Hva kan deles på et senere tidspunkt?
    • Hva kan ikke deles i det hele tatt? 

    En annen og viktig vurdering som må gjøres er å vurdere hva av dokumentasjonen fra prosjektet som er nødvendig å tilgjengeliggjøre for at andre skal kunne forstå hvordan forskningsdataene har blitt fremstilt, og hvordan studiene kan etterprøves og gjenskapes. 

    Andre Vurderinger

    Sletting og anonymisering

    • Det fins muligheter til å bevare deler av datamaterialet på en måte som ikke setter personvernet i spill. Anonymiserte data kan ikke spores tilbake til en enkeltperson og således oppheves personregelverket.
    • Et datasett er anonymisert når koblingsnøkkelen er slettet og i tilfelle transkripsjoner; når de er omskrevet slik at det ikke fremkommer identifiserende bakgrunnsvariabler, som f. eks kjønn, alder og bosted.
    • Husk at lydopptak av stemmer (herunder også forvrengte stemmer) og videomateriale regnes som personopplysninger i seg selv og skal slettes i henhold til de opplysninger du har gitt deltagerne og i Kanalregisterets meldeskjema.

    Forberedelser for arkivering

    Annen dokumentasjon

    • Som nevnt er det ikke alt datamateriale som lar seg anonymisere og dermed utgår muligheten om å arkivere datasettet åpent for allmennheten. Det er dermed ikke sagt at du ikke besitter materiale som kan falle inn under definisjonen forskningsdata og som kan være verdt av å arkiveres i et åpent forskningsdataarkiv. Dette kan være:
      • Spørreskjemaet du gir til respondentene
      • Intervjuguide
      • Notater uten personopplysninger eller identifiserende bakgrunnsvariabler
      • ReadMe-fil
      • Kodebok
      • Kode/script som er brukt, for eksempel som en Jupyter Notebook-fil.

    Gode metadata

    • Ved å publisere gode metadata (metadata= data om data) og utfyllende informasjon om datasettet legger du til rette for at dataene kan siteres og gjenbrukes på en forsvarlig måte, og risikoen for at dataene mistolkes eller misforstås minimeres.
    • Sitter du på et datasett som ikke kan arkiveres åpent, kan du, i tillegg til eksemplene i punktet nedenfor, likevel publisere metadata hvor du blant annet beskriver prosjektet, metodologien, innsamlingsmetoden, datatypene, geografisk informasjon, tid og dato for innsamling. Supplerende metadata og kontaktinformasjon legges inn i en ReadMe-fil som du legger ved.
  • Arkivering

    Arkivering er det siste trinnet i håndteringen av forskningsdata, men for å kunne ivareta tekniske, juridiske og etiske hensyn, skal du allerede ha planlagt dette stadiet tidligere i forskningsprossen. Råd om valg av egnet arkiv og hvordan arkivere finnes på OsloMets egen nettside om arkivering av forskningsdata. Universitetsbiblioteket kan gi veiledning og støtte til forsker gjennom flere tjenester knyttet til avslutning og arkivering, men også gjennom spesifikke kurs (oslomet.no).

  • Gjenbruk

    Gjenbruk av forskningsdata betyr at man benytter forskningsdata som andre allerede har samlet inn og sammensatt og/eller data som finnes åpent tilgjengelig.

    Nasjonale løsninger

    Tjenester for å søke 

    Finn datasett gjennom søk i disse søkemotorene