Transkribering - Ansatt

Transkribering - tale til tekst

Transkribering - tale til tekst

Manuelt eller automatisk, eller ja takk begge deler? Gjøre en god vurdering av hva som er rett for ditt forskningsarbeid. Her finner du også informasjon om egne rutiner for studenter.

OsloMet har godkjent to løsninger for automatisk transkribering:

Begge  løsningene over kostnadsfrie for OsloMets studenter og ansatte, og godkjente med tanke på personvern og sikkerhet. Bruker av Whisper fra andre nettsider (eksempelvis Nasjonalbiblioteket (nb.no) har ikke OsloMet avtale med.

Skal du tekste undervisningsmateriell; eksempelvis video, lydfil eller animasjon, kan du benytte innebygget funksjon i Panopto (oslomet.gitbook.io).

  • Manuell eller automatisk, eller ja takk begge deler?

    Transkribering av en lydfil kan generelt sett gjøres på to ulike måter, manuell eller automatisk. Ved å velge automatisk transkribering sparer du tid og ressurser på å gjennomgå taleopptaket.

    Men det er fallgruver ved å gjøre denne delen av arbeidet helautomatisk. Mister man verdifulle data ved å gå glipp av nyanser i tale som for eksempel toneleie og tenkepauser? Bruker det automatiske programmet (AI) andre ord og uttrykk som gjør at dataene rett og slett oversettes feil?

    Diskuter gjerne med kollegaer på eget fagfelt utfra behov hvilke erfaringer de har gjort seg før du bestemmer deg for manuell eller automatisk transkribering, eller en kombinasjon. Husk at om du velger automatisk bør du uansett korrekturlese.

    Det vil være en god praksis at transkriberingsmetode blir opplyst om for deltakerne i studien/forskningsprosjektet.

  • Personvern, røde- (sensitive) og gule data (alminnelige persondata)

    Behandling av røde (sensitive) data må alltid skje på godkjent system/plattform. Dette gjelder også transkribering. Sjekk OsloMets lagringsguide for å vurdere hvor du kan operere med sensitive data.

    Jobber du med alminnelige persondata, er det flere godkjente løsning å jobbe med transkribering:

  • Avspilling og manuell transkribering

    Manuell transkripsjon vil si å selv skrive ned det man hører/spilles av i lydfilen i Word el, for så å lagre dokumentet på godkjent sted.

    På denne står det om hvordan du laster ned og installerer godkjent programvare fra OsloMets Software Center. Både VLC, f4transcript og NVivo er programvare som støtter avspilling med funksjoner for start/stopp og spoling. VLC og f4transcript kan være å anbefale fordi de har støtte for tastatursnarveier/fotpedal og man kan tilpasse hastigheten på avspillingen.

  • Automatisk transkribering – Autotekst (UiO)

    OsloMet har åpnet opp for at alle brukere på OsloMet nå kan bruke den nye tale-til-tekst løsningen, Autotekst, som er installert lokalt på UiO.

    Gå til UiO sin nettside for å prøve den nye autotekst-løsningen (innlogging med OsloMet-bruker og Feide).

    Formater

    Nedlasting av .txt-format gir deg tekstfilen i komprimert tekst, mens .srt-formatet gir deg sekvenser av innspillingen i tidsintervaller.

  • Automatisk transkribering – Word online

    Microsoft har egen automatisk transkriberingsfunksjon i Word. Denne er tilgjengelig kun i web-versjonen, og nås ved å logge seg på OsloMet sin Office365 og starte Word. OsloMet sin versjon av Microsoft Office er sikkerhetsklarert for at du kan benytte løsningen for det som omfattes av gule data.

    Medieseksjonen har laget en fin veiledning i videoformat for hvordan du transkriberer i Word (FilMet).

    To måter

    Det er i utgangspunktet to måter den automatiske transkriberingsfunksjonen kan benyttes på. Du kan enten (1) sende inn et ferdig lydopptak (lydfil med opptak av intervju/samtale).

    Den andre funksjonen, er å starte transkribering gjennom et (2) direkteopptak. Dette frarådes, fordi man ikke har kontroll over hva som blir sagt i lydopptaket. Alternativt kan direkteopptaks-funksjonen benyttes ved avspilling av et ferdig lydopptak. 

    Tidsbegrensning

    Microsoft Word har foreløpig kun gitt 300 minutter (5 timer) til rådighet per måned per bruker og denne begrensningen kan per i dag ikke utøkes.

  • Behandling av lydfiler på pc

    Opplasting av lydfil

    Lydfilen som skal hentes opp til transkribering må være tilgjengelig fra din OsloMet-laptop, gjerne på et lagringsområde i OneDrive. Privat laptop er ikke godkjent for å behandle eller oppbevare lydfiler til forskning da dette er å anses som persondata.

    Lagring, hold orden på lydfilene

    Vi anbefaler at du er nøye med filplassering. Det er viktig at datafiler ikke blir tilfeldig lastet ned eller kopiert på ulike plasser, men at dette gjøres til din prosjektmappe (OneDrive eller Teams) som er sikret sletting når prosjektet er avsluttet eller når materiale ikke behøves mer. Det samme gjelder lydfilen.

  • Automatisk transkribering – andre leverandører

    Det finnes en rekke andre transkriberingstjenester med samme funksjon som Microsoft Word og Autotekst (Wisper – UiO) på markedet, men foreløpig har ikke OsloMet inngått avtale med noen av disse.  Det betyr at hverken Googles “Speech to text” eller NVivo Transcription (som leveres gjennom Speechmatics) hverken er tilgjengelige eller kan benyttes ved OsloMet. Det samme gjelder Benevis som benytter Google i bakkant.

  • Egne rutiner for studenter

    Som student kan du benytte web-versjonen av Microsoft Word (med OsloMet-bruker) eller Nettskjema Diktafon-app til opptak og transkribering.

    Husk at det er ulovlig å laste ned en lydfil med persondata til en private maskiner, så påse at man enten jobber i web-versjonen av Microsoft Word (pålogget som OsloMet-bruker) eller forholder seg kun til Nettskjema der lydfilen har kommet inn gjennom Nettskjema Diktafon-app. Husk også å sjekke at det ikke er sensitive data i opptaket før du går i gang med transkriberingen.

    Har du et ferdig lydopptak i Nettskjema Diktafon-appen vil den være automatisk transkribert og tilgjengelig. Her kan du avlytte lydfilen samtidig som du korrekturleser den tekstlige utgaven, men du kan altså ikke laste ned filene til privat utstyr.

Kontakt IT-servicedesk

Kontakt IT-servicedesk