Forskning, Humaniora

Dokumenterar utdöende språk

Ungefär hälften av jordens 6000 språk kommer att dö ut inom hundra år. I Lund skapas nu ett fönster mot en svunnen tid – här kan man lyssna till språk som inte längre talas tack vare en särskild resurs för digital språkdokumentation.

Niclas Burenhult

Niclas Burenhult är en av forsknings­ledarna i språk­resursprojektet.

Ett språk försvinner var fjortonde dag. Lingvisten Niclas Burenhult och hans forskarteam har genom ett infrastrukturprojekt finansierat av Riksbankens Jubileumsfond skapat en digital språkdokumentationsresurs för att bevara utrotningshotade språk i Sydöstasien.

– Det är ingen ny sak att språk dör ut – det har alltid skett – men det som skiljer idag är takten, berättar Niclas Burenhult, docent i allmän språkvetenskap och en av forskningsledarna i språkresursprojektet

En av förklaringarna som anges ligga bakom den snabba språkdöden är de alltmer intensiva kontakter människor har idag med omvärlden, det vill säga globaliseringen. Cirka hälften av jordens befolkning har idag något av de tio största språken i världen som sitt första språk.

Under tre år har forskarna byggt upp det som kommer att vara Nordeuropas största språkdokumentationsresurs – med fokus på den austroasiatiska språkfamiljen i Sydöstasien. De båda forskningsledarna i projektet, Niclas Burenhult och Nicole Kruspe, har tillbringat flera år av fältstudier i området och projektet är nu inne på sluttampen. Det handlar ytterst om att bevara ett immateriellt kulturarv åt framtida generationer – borttynande språk, musik, ritualer, och inhemsk erfarenhet och kunskap som huvudsakligen bärs av skriftlösa samhällen.

– Vi har digitaliserat och organiserat den dokumentation som gjorts under åratal av fältinsamling av olika forskare – data från språk som snart kommer att dö ut eller som redan försvunnit, säger Niclas Burenhult. Man kan likna språkresursen vid en framtidens tidsmaskin. Vi vet inte idag vilka frågor man kommer att ställa i framtiden, men när frågorna väl dyker upp kommer man att kunna använda resursen som ett fönster mot en svunnen tid.

Språkresursens inriktning på den austroasiatiska språkfamiljen har sin historia i att Lund sedan 70-talet haft en rik forskning i Sydöstasien. Det hela startade med folkloristen och forskaren Kristina Lindell. Hon jobbade med minoriteter i Sydöstasien och träffade då bland annat en språkinformant, Damrong Tayanin (Kam Raw), som senare blev verksam här i Lund inom lingvistik. Han talade kammu, ett minoritetsspråk i Laos. Han samarbetade med en rad andra forskare – musikologer, botaniker, religionshistoriker och lingvister – som åkte till Laos och gjorde fältstudier, vilket genererade en enorm mängd data som nu alltså digitaliserats i projektet.

Läget för tre år sedan var att man stod med unika nya och gamla data, i många olika typer av format. Data som var svårtillgängliga för framtidens forskare, dels av tekniska skäl, dels för att de var utspridda hos de enskilda forskarna.

Jens Larsson

Mycket av dokumentationen har gjorts på rullbandspelare, som Jens Larsson demonstrerar.

– Mycket av det vi har digitaliserat är fält-inspelningar som finns på rullband från 70-talet. Rullband är relativt lättillgängliga fortfarande idag medan det under 90-talet i den digitala barndomen fanns många tillfälliga format som idag kan vara svåra att komma åt, berättar Jens Larsson, en av de ansvariga för Humanistlaboratoriets korpus-server, det vill säga den hård- och mjukvara som används i projektet. Att Humanistlaboratoriet har denna korpus-server har varit avgörande för att kunna genomföra projektet.

Den digitala språkresursen innehåller just nu 42 av språkfamiljens totalt 164 språk, varav de flesta är utrotningshotade minoritetsspråk.

Typen och omfattningen av dokumentationen varierar, men språkresursen är multi-medial och kan integrera gamla och nya data. Den innehåller allt från ordlistor, ljudinspelningar av daglig konversation till videoinspelningar. I språkresursen finns 1250 timmar ljudinspelningar och 250 timmar videoinspelningar.

– En av de viktigaste poängerna med den här resursen är att den är tvärvetenskaplig. Samarbetena med till exempel botaniker kan leda till att man i en enkel ordlista vid ordet för en viss växt också kan länka till bilden av ett pressat exemplar av växten tillsammans med en botanikers klassificering av den, liksom transkriberade inspelningar av hur växten skördas eller på andra sätt utnyttjas. Likaså kan inspelade religiösa sånger studeras ur en musikologs synvinkel samtidigt som texten kan transkriberas av en lingvist och analyseras av en religionshistoriker, berättar Niclas Burenhult.

Forskargruppen arbetar för att språkresursen ska bli en tillgång för forskare, studenter och språksamhällena själva i framtiden. Den är också avsedd att vara en mötesplats för forskare runtom i världen som forskar på de här språken, men också en rik källa för studentuppsatser och avhandlingsprojekt. Eftersom det mesta i språkresursen är fritt tillgängligt via Open Access kan man ladda ner det man är intresserad av och ladda upp igen när man har arbetat med den.

Projektet har inspirerats av och har samarbeten med två andra språkresurser i Europa. De har båda en bredare inriktning på utrotningshotade språk från hela världen.

Text: Gisela Lindberg

Foto: Gunnar Menander

FAKTA Språkresursen RWAAI

Forskargruppen består av Niclas Burenhult, Sandra Cronhamn, Håkan Lundström, Nicole Kruspe, Jens Larsson, Jan-Olof Svantesson och Marcus Uneson.

Förkortninggen RWAAI står för Repository and Workspace for Austroasiatic Intangible Heritage.

Läs mer på projektets hemsida: www.lu.se/rwaai