Dette er en av sedlene som til sammen utgjør Kongespeilet.

Nå kan en ny del av det gammelnorske materialet publiseres i digital form

Juliane Tiemann Juliane Tiemann Ph.d. ved LLE UiB

Publisert 08.01.2018 - 10:42

I 2016 flyttet språksamlingene til Universitetet i Bergen. Universitetet i Oslo hadde hatt langsiktig ansvar for å ivareta og utvikle språksamlingene som var samlet inn siden 1930, men i 2016 overtok Universitetet i Bergen denne oppgava. Språksamlingene omfatter store mengder verdifullt materiale som representerer et stort potensial for framtidig forsking. Det overførte materialet omfatter omtrent 70 tonn med arkivmateriale for dialektord, stedsnavn, bokmål, nynorsk og norrønt, og en omfattende dokumentasjon av norsk talemål i form av opptak, transkripsjoner og kart. Nå har Institutt for lingvistiske, litterære og estetiske studier (LLE) ved Universitetet i Bergen det overordnede faglige ansvaret for materialet, som nå er blitt del av Universitetsbiblioteket i Bergens samlinger.

Flere prosjektet har arbeidet med materialet. Når det gjelder det norrøne materialet, så ble det bygget opp et rikt arkiv med digitalt tilgjengelige middelaldertekster og håndskriftfaksimiler. Dette skjedde under Medieval Nordic Text Archive (Menota) som også flyttet tilbake i Bergen i 2016. Det å ha slike prosjekter og databanker i Bergen utvider arbeidsmulighetene for et sterkt norrønt miljø ved UiB. Jeg begynte selv som stipendiat i norrøn filologi og er nå en av de første som bruker det gammelnorske seddelmaterialet igjen: Det danner et grunnlag for ph.d.prosjektet mitt. Målet er det samme som i Menota: Å bevare, formidle og publisere materialet i digital form.

Gammelt materiale, ny forskning

En stor del av språksamlingene er allerede digitalisert, men seddelarkivet som kom til Bergen omfatter mye verdifull informasjon som ennå ikke er overført til digitale arkiver. Seddelarkivet inneholder bl.a. teksten til Konungs skuggsjá (Kongespeilet) etter AM 243 b α fol. som er tekstgrunnlaget for den lingvistiske analysen i prosjektet mitt. Dette er et av de viktigste håndskriftene på gammelnorsk språk og regnes av mange som hovedverket i norsk middelalderlitteratur. Teksten er et pedagogisk-filosofisk skrift i form av dialog mellom far, kong Håkon Håkonsson og sønn, Magnus Lagabøte, og ble forfattet i Bergen på midten av 1200-tallet. Hovedteksten er delt opp i forskjellige seksjoner som omhandler bl.a. kongens makt, naturforhold, lov og rett, og praktiske og moralske råd angående kjøpmannskap, skikk og bruk ved hoffet og militærvesenet. Kongespeilet forteller også mye om verden sett fra norsk perspektiv og har vært gjenstand for historisk og litterær forskning i flere år. Men det som fremdeles mangler, er detaljerte lingvistiske undersøkelser. Siden teksten har den en betydelig lengde (70 kapitler fordelt på 82 pergamentblad) og er skrevet som en koherent tekst, er den et veldig bra grunnlag for språklige analyser. Jeg vil se nærmere på den syntaktiske variasjonen man finner i gammelnorsk, og de faktorene som påvirker ulik ordstilling. For slike analyser er det påkrevd at språkmaterialet er opparbeidet på en grundig måte. Det første steget i en slik bearbeidelse ble heldigvis allerede gjort under Dokumentasjonsprosjektet på 1900-tallet.

Fra arkivskuffer til datafiler

Som del av Dokumentasjonsprosjektet ble materialet fra den eldste fasen av det norske språket dataført under Gammelnorsk Ordboksverk. Dette skulle gi en samlet og rasjonell tilgang til norsk mellomalderspråk.

Målet med dette prosjektet var å bygge opp et fullstendig ordarkiv med alle forekomster av ord i norsk språk fra de første skrevne belegg på norsk fra omkring 1200. Gammelnorsk Ordboksverk har om lag 650 000 ordbokssedler i samlinga over litterære tekster, lovtekster og diplom. Alt materialet skulle overføres til en database inklusive all grammatisk merking, slik at ethvert ord kan kalles fram med fulle grammatiske opplysninger. Fullt lemmatisert vil dette materialet bli et eminent tilskudd til Menota og til arbeidet i fagmiljøet ved Universitetet i Bergen. Ressursene i seddelmaterialet blir da lagret datamaskinelt, slik at de kan bli lettere tilgjengelige, og i tillegg forenkle studiet av eldre språk helt generelt.

Formatet som ble brukt for arbeidet med tekstene var seddelformat (ca. 8 x 18 cm) med tekststykker fra 6-10 linjer per ordboksseddel. Dette sikrer at hvert oppslagsord (leksem) er gitt i en best mulig kontekst. Det finnes også referanser til side og linje i tekstutgava på hver ordboksseddel. Rent teknisk ble første sedlene skrevet ut for hånd. Senere brukte man skrivemaskin og stensilmaskin. Det ble laget så mange like sedler av samme tekststykket som det er oppslagsord i det. Hvert ord har fått grammatisk bestemmelse (ordklasse og bøyningsform), og er ført opp som oppslagsord i normalisert form øverst på seddelen, ved sida av ordets skriveform i handskriftet.

Under Dokumentasjonsprosjektet på 1990-tallet ble kortene digitalisert ved Universitetet i Oslo og gjort om til elektroniske tekster. En stor del av tekstmaterialet er allerede overført til Menota, slik at teksten til Konung skuggsjá ligger til rette med diplomatarisk transkripsjon og med ca. 2/3 av ordene morfologisk annotert. Men det mangler fremdeles grammatisk bestemmelse for 1/3 av ordene som kun finnes i seddelformat. Slik hadde tilstanden vært i en lang periode – men etter den tida da samlingene sto i fare for å bli døde arkiver og miste sin relevans, har materialet endelig blitt tatt i bruk igjen i dag. Nå blir altså en ny del av det nesten 100 år lange arbeidet gjort tilgjengelig for ny forskning. Digitalisering er ekstremt viktig slik at dette materialet kan stilles til rådighet for et bredere publikum. Det er språkdokumentasjon og tilgjengeliggjøring av materialet som står i fokus og som gjør det mulig å fullføre nye prosjekter om gammelnorsk språk.

Syrefri oppbevaring

Før jeg kan begynne med en videre analyse av språket i Konungs skuggsjá må den manglende informasjonen suppleres i den eksisterende datafila. Siden en slik annotasjon er veldig tidskrevende er jeg glad for at en stor del er allerede blitt gjort og digitalisert. I tillegg kan all informasjon som fremdeles mangler i fila, finnes nedskrevet på sedlene. Mye kan tilføyes automatisk, slik at arbeidet generelt sett går mye fortere enn før det datamaskinelle arbeidet. Men analysen som ble gjort på sedlene er en ressurs som forenkler arbeidet med teksten og annotasjon enda mer, og forhindrer at det samme arbeidet må gjøres flere ganger. For å kunne bruke denne ressursen sto jeg i kontakt med førstebibliotekar Rune Kyrkjebø ved Universitetsbiblioteket og arkivar ved språksamlingene Kristin Synnøve Kjos, som bl.a. er ansvarlig for lagring og overføring av språksamlingens materiale. Jeg fikk informasjon om at det gammelnorske papirmaterialet ble registrert og pakket om. Men før jeg kunne arbeide med språksamlingene, måtte de behandles for å sikre at det verdifulle materialet skal bli bevart. Flere av Språksamlingenes arkiver går gjennom dypfrysing for å ta knekken på «ubudne gjester», før materialet flyttes til nye arkivrom. Treskuffene erstattes av spesiallagede syrefrie bokser.

Språksamlingene er i bruk igjen

I begynnelsen av desember 2017 var materialet klart. Jeg fikk beskjed om at de første fire pappeskene med teksten til Konungs skuggsjá ligger til rette på manuskriptlesesalen. Dermed er jeg den første i en lang periode som arbeider vitenskapelig med materialet og hjelper videre med å gjøre det eksisterende analoge seddelarkivet datamaskinelt tilgjengelig. Siden de grammatiske opplysningene på sedlene ikke følger XML-kode brukt i Menota, måtte jeg finne fram til en mulighet for å overføre informasjonen på en rask og ordentlig måte. Etter å ha ekstrahert alle ordformene som manglet grammatisk bestemmelse i datafila, har jeg opprettet ei enkel Excel-fil der jeg kan omdanne bestemmelse fra sedlene semi-automatisk til den tilsvarende XML-opplysninga. Deretter kan jeg tilføye informasjonen til den eksisterende datafila. Arbeidet er fremdeles møysommelig, men slik blir det mulig å supplere resten av annotasjonen innen 1-2 måneder, en jobb som ellers ville ha tatt omtrent et halvt år eller lengre.

Ved å bruke den oppmerkede teksten kan man da lett finne fram til enkelte ord, eller bruke materialet videre for syntaktiske analyser – slik som jeg gjør det i prosjektet mitt.

Datamaskinell behandling av norrøne tekster kan være et tjenlig hjelpemiddel i arbeidet med klart spesifiserte problemstillinger. I tillegg er det ei god hjelp i arbeidet med språklige granskinger og med ordboksmateriale.

Nå kan en ny del av det gammelnorske materialet publiseres i digital form

Gammelt materiale, ny forskning

Fra arkivskuffer til datafiler

Syrefri oppbevaring

Språksamlingene er i bruk igjen

Meld deg på nyhetsbrev fra På Høyden!