Viden og værktøjer
Kan man tælle skriveudvikling?
At børns tekster forandrer sig over tid, er på sin vis indlysende. Mens teksterne i de tidlige år handler om ting og fænomener i børnenes nærmeste livsverden, kan de senere udvikle sig til mere udfoldede kommunikative og funktionelle tekster, hvor eleverne arbejder modtager- og genrebevidst med de sproglige valg. Teksterne forandrer sig selvfølgelig også på sætnings- og ordniveau fra simple tekster med brug af simple enkeltord til længere tekster med brug af abstrakte og domænespecifikke ord og mere kompliceret syntaks. Hvad der imidlertid er mindre indlysende, er, hvordan denne udvikling på et mere detaljeret lingvistisk niveau faktisk udfolder sig hen over de år, børn går i skole, og hvordan sproglige forskelle i elevernes tekster hænger sammen med baggrundsfaktorer hos de enkelte elever som fx elevens generelle skrivelyst og læse- og skrivevaner samt faktorer som alder, køn og social baggrund.
Med digitaliseringen af børns tekstpraksisser er der imidlertid opstået bedre muligheder for at undersøge disse dimensioner, eftersom børns tekster som udgangspunkt er tilgængelige i digitalt format. Dette gør det lettere at indsamle elevtekster og gøre dem tilgængelige for kvantitativ analyse med digitale værktøjer. Der ses derfor en spirende interesse både inden for dansk og international skriveforskning i at undersøge sproglige udviklingsmønstre i tekstkorpusser bestående af elevtekster. Herhjemme ses denne interesse fx i det danske ATEL-projekt, som kortlagde udviklingsmønstre i elevtekster fra indskolingen (se fx Bremholm et al., 2022), samt i mit eget ph.d.-projekt (Tannert, 2022), som jeg vender tilbage til senere i denne klumme.
Digital humaniora
Interessen i at udnytte kvantitative, digitale metoder til at undersøge tekster er ikke blot reserveret til den pædagogiske skriveforskning, men afspejler en større bevægelse inden for human- og socialvidenskaberne. Den amerikanske filosof David M. Berry (2011) omtaler denne bevægelse som en ’computationel vending’. Det vil sige som en stigende orientering mod at integrere computationelle, kvantitative analysemetoder til at belyse traditionelle human- og socialvidenskabelige spørgsmål om bl.a. litteratur, sprog, medier og historie. Raison d’etre bag denne vending er, at man kan udnytte computerens regnekraft til at undersøge empirisk materiale på en større skala end tidligere, og det bliver derigennem muligt at opdage og beskrive mønstre på tværs af det empiriske materiale, som man ikke ville opdage gennem en manuel, kvalitativ analyse.
Et nøglebegreb i denne sammenhæng, som særligt har inspireret flere litteraturforskere, men som også har været et vigtigt teoretisk omdrejningspunkt i mit eget ph.d.-projekt, er Franco Morettis (2013) begreb om ’distant reading’. Det er oprindelig et litteraturvidenskabeligt begreb, men i begrebet ligger også kimen til et vigtigt udgangspunkt for i hvert fald dele af den kvantitative skriveforskning herhjemme og internationalt. Distant reading indebærer, at man modsat den traditionelle nærlæsning (’close reading’) træder tilbage og undersøger mønstre på tværs af store mængder af tekst for at generere nye hypoteser og skabe et bredere perspektiv på elevers skriveudvikling – ikke som erstatning for kvalitative analyser af enkeltelevers tekster, men som et komplementerende analytisk perspektiv, der kan undersøge skriveudviklingsmønstre på tværs af tekster, skrivere og undervisningskontekster.
Ph.d.-projektet
Et eksempel på en sådan tendens er mit eget ph.d.-projekt, hvor jeg undersøgte skriveudviklingsmønstre i et korpus af 464 elevtekster fra 5.-9. klasse (Tannert, 2022). Analyserne baserede sig på værktøjer inden for det lingvistiske og datalogiske tværfelt, der kendes som Natural Language Processing (NLP). NLP-værktøjer kan processere og analysere tekstdata på baggrund af sprogmodeller, der bl.a. er udviklet på baggrund af maskinlæring. I mit projekt undersøgte jeg ved hjælp af sådanne NLP-værktøjer fem variable i elevernes tekster: tekstlængde (det totale antal ord), ordlængde (det gennemsnitlige antal bogstaver i hvert ord), ordvariation (andelen af unikke ord), sætningslængde (det gennemsnitlige antal ord i hver syntaktiske periode) samt gennemsnitlig dependensafstand (den gennemsnitlige afstand mellem indbyrdes afhængige ord i en sætning). I projektet var jeg både interesseret i at undersøge, om der var forskelle mellem tekster skrevet af elever på forskellige klassetrin, samt om der var sammenhæng mellem sproglige træk i teksterne og elevernes køn, sociale baggrund, skrivelyst samt læse- og skrivevaner i fritiden. Data om de sidstnævnte variable blev indsamlet hos de deltagende elever gennem et spørgeskema.
Skriveudviklingens non-linearitet
Et af projektets centrale resultater er, at skriveudvikling i skolen ikke nødvendigvis manifesterer sig som en lineær sproglig udvikling mellem klassetrin. Ud af de fem undersøgte variable i teksterne var det kun tekstlængde, der steg kontinuerligt for hvert klassetrin. Dette betyder, at eleverne gennemsnitligt set ikke skriver hverken længere ord eller opbygger længere sætninger (perioder) for hvert øget klassetrin, ligesom analyserne heller ikke viste en systematisk og klassetrinsvis stigning i elevernes evne til at variere ordvalget i teksterne. Det er naturligvis ikke det samme som, at der ingenting sker på disse parametre i elevernes tekster, men blot at der ikke kunne observeres kontinuerlige stigninger for hvert klassetrin i de fem variable, og at de forandringer, der sker i teksterne, er grammatisk og kvalitativt set mere komplicerede, end hvad der kan indfanges gennem de fem undersøgte NLP-variable.
Som supplement til den kvantitative analyse undersøgte jeg derfor 18 elevtekster kvalitativt, som havde fået forskellige værdier i de kvantitative analyser, og som var skrevet af elever på forskellige klassetrin. I mine analyser kunne jeg se, at den syntaktiske udvikling i teksterne fx så ud til at være knyttet til forskellige former for syntaktisk kompleksitet, og at denne kompleksitet varierede mellem de to teksttyper i korpusset (berettende og beskrivende). Det vil sige, at nogle typer af syntaktisk kompleksitet var til stede i de beskrivende tekster (fx brugen af adjektivistiske relativsætninger i forfeltet), mens andre typer af syntaktisk kompleksitet var mere til stede i de berettende tekster (fx brugen af forskellige former for tids- og stedsadverbielle led). I mine analyser kunne jeg ligeledes se, at eleverne varierede længden af bestemte led (specifikt nominalfraser) alt efter teksttypen, ligesom teksttypen også havde betydning for de kohæsive bånd, eleverne anvendte. Analyserne viste således store sproglige forskelle mellem teksttyperne, hvilket indikerer, at skriveudvikling, når man ser på mellemtrins- og udskolingstekster, ikke er en lineær udvikling af sprogligt set mere komplicerede tekster, men snarere sætter sig igennem som en stigende evne til at variere mellem forskellige former for sproglig kompleksitet relativt til skriveopgave og genre. Skriveudvikling på mellemtrinnet og i udskolingen må således forstås som et genrespecifikt, non-lineært og funktionelt fænomen.
Skriveudviklingens ulighedsdimension
Et andet væsentligt resultat fra projektet angår sammenhængen mellem elevernes køn og sociale baggrund på den ene side og de sproglige ressourcer i elevernes tekster på den anden. Analyserne viste en klar statistisk sammenhæng mellem elevernes køn og længden af elevernes tekster. Særligt ved de beskrivende tekster var der en stabil kønseffekt på over 35 ord i pigernes favør. De kvantitative analyser viste ligeledes, at kun en meget lille del af denne effekt kunne forklares af, at pigerne havde højere skrivelyst eller bedre læse- og skrivevaner i fritiden. Samme tendens viste sig ved ordlængde i teksterne, mens der til gengæld var en omvendt kønseffekt ved sætningslængden (periodelængde), hvor drengene ved begge teksttyper skrev en anelse længere sætninger. I analyserne af betydningen af social baggrund var mønsteret det samme. Social baggrund (her målt på baggrund af forældrenes nuværende beskæftigelse) havde en stabil effekt ved begge teksttyper på tekstlængde og ved de berettende tekster på ordlængde, og igen viste skrivelyst samt læse- og skrivevaner sig kun at have en lille forklarende effekt. Elever fra den højeste sociale gruppe skrev altså både markant længere tekster og længere ord, og meget lidt af denne forskel hænger i mine analyser sammen med, at eleverne fra den øverste sociale gruppe har større skrivelyst, eller at de læser og skriver mere i fritiden. Ved sætningslængde havde social baggrund ikke nogen statistisk signifikant betydning.
Analyserne viste således, at den sociale og kønsmæssige ulighed, som ofte diskuteres i relation til skolen generelt, ikke bare slår igennem i overordnede outcomes som karakterer, testresultater eller uddannelsesvalg, men faktisk kan spores helt nede på de syntaktiske og leksikale niveauer af elevernes tekster. En del af den variation, vi ser i elevernes tekster på de enkelte klassetrin, hænger altså sammen med de baggrundressourcer, som eleverne tager med sig ind i skriveundervisningen.
Kan man så faktisk tælle skriveudvikling?
Skriveudvikling er således et kompliceret fænomen. Det er (som minimum) både et lingvistisk, kognitivt, socialt, diskursivt og identitetsskabende fænomen. Det er med psykometriske termer det, man vil kalde for et multidimensionelt konstrukt. Det betyder, at ingen bestemt metode eller teoretisk optik vil kunne undersøge og beskrive fænomenet i al dets kompleksitet. Det betyder samtidig også, at spørgsmålet, som udgør titlen på denne forskerklumme, ikke fuldstændigt kan besvares. Kan man tælle det? Ja, det kan man godt, men det giver selvfølgelig ikke mening at tælle det hele. At tælle sproglige udviklingstræk i store tekstkorpusser bidrager med viden om generelle skriftsproglige udviklingsmønstre, men det overser fx samtidig væsentlige sociale og identitetsmæssige dimensioner. Det er der heldigvis andre, der har undersøgt. Hvis vi for alvor skal forstå børns skriveudvikling, må vi derfor betragte og fortolke alle disse dimensioner som komplementerende perspektiver, der til sammen gør os klogere på, hvordan børn udvikler sig som skrivere.