Om transkripsjonene
Talespråket er spilt
inn på SONY (MZ-N10) minidisker. Dernest
er lydfilene lagt over på CD for å
bli transkribert i programmet Transcriber.
I COLA-prosjektet følges TEIs
(Text Encoding Iniciative) anbefalinger
for transkripsjon.
Transkripsjonene er ortografiske og har
ingen tegn. Det er meningen at man skal
høre på lydfilen samtidig som
man leser transkripsjonen.
Transkripsjonene er lagt ut på nettet
koblet til lyd, slik at man kan høre
og lese transkripsjonene samtidig. Man kan
søke på ord, antall ord, sosiale
klasser, etc. Man får tilgang til
korpuset med brukernavn og passord som fås
ved å sende en epost til info@colam.org
Tilbake
|