Transkribering - Ansatt

Transkribering

Transkribering

Manuelt eller automatisk? Avklar hva som er rett for ditt forskningsarbeid.

Transkribering av en lydfil kan generelt sett gjøres på to ulike måter. Den ene er å gå gjennom lydfilen manuelt, og skrive ned det man hører underveis. Dette kalles også for manuell transkripsjon.

Se programvaresiden for programvare OsloMet tilbyr som støtter prosessen for manuell transkripsjon.

Det finnes også programmer som tar seg av transkribering (automatisk). En transkripsjons-app bruker gjerne AI (kunstig intelligens). AI vil da tolke din lydfil og gjøre innholdet om til tekst.

Med en Microsoft-konto fra OsloMet kan du benytte et slikt automatisk transkriberingsprogram som er tilgjengelig gjennom Word (online). Les mer under.

  • Om Automatisk transkribering i Word

    I januar (2021) lanserte Microsoft en egen automatisk transkriberingsfunksjon gjennom MS Word. Funksjonen er tilgjengelig via deres MS365-løsning for brukere med gyldig Microsoft lisens når man logger seg på web-versjonen.

    Tradisjonelt har ikke IT-avdelingen hatt for vane å skrive eller markedsføre noe særskilt om spesifikke muligheter i hverken Office-programmene eller andre applikasjonsløsninger, men siden transkribering er såpass aktuelt for veldig mange brukere på OsloMet og at dette er en funksjon med et spesielt personvern-fokus, synes vi det er både viktig og riktig at denne funksjonaliteten kommuniseres på rett måte.

  • Hvordan fungerer transkriberings-funksjonen i Word?

    Den automatiske transkriberingsfunksjonen i Word er tilgjengelig kun i web-versjonen som nås ved å logge seg på OsloMet sin MS365 (tidligere O365).

    To måter

    Det er i utgangspunktet to måter den automatiske transkriberingsfunksjonen kan benyttes på. Du kan enten (1) sende inn et ferdig lydopptak (lydfil med opptak av intervju/samtale).

    Den andre funksjonen, er å starte transkribering gjennom et (2) direkteopptak. Den siste frarådes, fordi man ikke har kontroll over hva som blir sagt i lydopptaket. Alternativt kan  direkteopptaks-funksjonen benyttes ved avspilling av et ferdig lydopptak (se egen rutine for studenter under). 

  • Hvilke personvern-hensyn gjelder for bruk?

    Så lenge transkriberingsfunksjonen i MS Word er en del av MS Office, Microsoft sin skyløsning gjelder samme prinsipper for dataklassifisering som for Microsoft ellers, noe som betyr at du kun kan benytte løsningen for gule data. Det vil si alminnelige personopplysninger, under forutsetning av at du har samtykke til dette på forhånd av deltakerne.

    Hva med røde (sensitive) persondata?

    Automatisk transkribering av røde data er ikke godkjent. Denne type behandling må skje på system som er godkjent for behandling og lagring av røde data. Se lagringsguiden.

    For å unngå at sensitivt materiale benyttes inn i en tjenesten, må du derfor være kjent med innholdet av lydfilen før du sender den til transkribering.   

    Informasjon til deltaker

    Det vil være en god praksis at transkriberingsmetode er blitt opplyst om for deltakerne i studien dersom du skal benytte dette i forskning.

  • Hvor lagres mine data?

    Opplasting av lydfil

    Lydfilen som skal hentes opp til transkribering må være tilgjengelig fra din pc, gjerne på et lagringsområde i OneDrive.

    Når programmet leser lydfilen sendes lyddataene til et program hos Microsoft («speech-to-text») som ved hjelp av kunstig intelligens har lært seg opp til å forstå tale og oversette dette til tekst.

    Det transkriberte materiale lagres ikke hos Microsoft, men sendes direkte til din pc når det er ferdig transkribert, hvor du har mulighet for å laste ned tekstfilen.

    Hold orden på filene

    Vi anbefaler at du er nøye med filplassering og at slike datafiler ikke blir tilfeldig lastet ned eller kopiert på ulike plasser, men at dette følger med i din prosjektmappe (i Teams eller OneDrive) som er sikret sletting når prosjektet er avsluttet eller når materiale ikke behøves mer. Det samme gjelder lydfilen.

  • Egen rutine for studenter

    Er du student og ønsker å benytte den automatiske transkriberingsfunksjonen i Word?

    Les videre her.

    Hvordan omgå lagring på privat utstyr

    Det er nemlig ikke lov til å laste ned en lydfil med persondata på en privat maskin, så spesielle rutiner må regler følges.

    Har du et ferdig lydopptak i Nettskjema, innlest gjennom Diktafon-appen, er løsningen den at du kan spille den av i nettleser samtidig som du benytter opptaksfunksjonen i Word (online). Som om du skulle simulere et direkte-opptak.

    Hvor finner jeg den transkriberte filen?

    Når intervjuet er ferdig avspilt opprettes det da en lydfil som legger seg på din OneDrive-mappe under mappen\Transcribed Files.

    Husk å påse at det ikke er sensitive data i opptaket før du går i gang med transkriberingen og at du ikke synkroniserer ned til privat maskin, men lar det forbli i O365-online.

  • Hvilken kvalitet kan forventes?

    Hva med norsk språk?

    Programmet håndterer flere språk og den er selvsagt best «trent» på engelsk, men av de testene vi har gjort på norsk fungerer den nokså godt også der.

    Word versus NVivo og andre

    Tester som noen på OsloMet har utført viser at kvaliteten på transkribering i Word ligger over kvaliteten som kom ut fra henholdsvis Google og NVivo sine transkriberingsløsninger på det samme tekstunderlaget.

    Hva om flere snakker?

    Programmet håndterer også at flere snakker i gruppe, men jo flere personer i dialog jo mer krevende er det selvsagt for programmet. Og jo flere dialekter, jo vanskeligere har den med å forstå. Vi anbefaler å teste ut funksjonen noe før den vedtas å bli benyttet. Hvis kvaliteten bare blir sånn passe kan tiden du trenger for å renskrive materiale kanskje ta like lang tid som om du skulle ha transkribert alt manuelt fra start.

    Tidsstempel

    Tekstfila er angitt med tidsstempel for å kunne følge tiden gjennom samtalen, hvem sa hva når.

  • Tidsbegrensning

    Microsoft har foreløpig kun gitt 300 minutter (5 timer) til rådighet per måned per bruker og denne begrensningen kan per i dag ikke utøkes.

  • Leverandører av andre transkriberingstjenester

    Det finnes en rekke andre transkriberingstjenester ala Microsoft Word på markedet, men foreløpig har ikke OsloMet inngått avtale med noen andre leverandører.

    Enkelte selskaper selger sin transkripsjonstjeneste under eget navn, men hvor leverandøren av selve transkriberingen kan være levert fra enten Google eller Microsoft. Eksempelvis Benevis som benytter Google sin transkriberingsfunksjon i bakkant.

    En tredjeleverandør, Speechmatics, selger sitt produkt gjennom det som mange kjenner som NVivo Transcript. 

    Hva koster det?

    Både Benevis og NVivo Transcript tar en kostand ved at man må kjøpe et visst antall transkriberingsminutter. MS Word er derimot gratis inntil videre.