Korpus

Page history last edited by PBworks 3 yrs ago

Ordet korpus kommer fra latin og betyr "kropp" eller "legeme".

 

I lingvistikken er et korpus en samling av tekst eller tale som kan brukes til språkvitenskapelige undersøkelser. Det kan inneholde ulike sjangrer (skjønnlitteratur, avisartikler osv.) som i Oslo-korpuset, eller inneholde én spesifikk sjanger som i Norsk Aviskorpus. Ved å samle store mengder tekst og kode den, kan forskere overvåke utviklingen av språket. Hvilke ord eller fraser bruker vi ofte? Hvilke ord dukker opp eller slutter vi å bruke? Korpus kan være et godt redskap for å studere språket i bruk.

 

Lingvistiske korpus er store, elektroniske samlinger av skriftspråk eller talespråk. Korpus brukes i empiriske studier av språkstruktur og språkbruk, og som treningskorpus for språkteknologiske applikasjoner. Aksis har bred erfaring med oppbygging, tilrettelegging, administrasjon og distribusjon av lingvistiske korpus, både enspråklige korpus, parallellkorpus og talemålskorpus med digitalisert lyd. Vi utvikler grensesnitt for søk via web eller frittstående applikasjoner.

 

Comments (0)

You don't have permission to comment on this page.