Nationalt Videncenter for Læsning udvikler i samarbejde med pædagoger, lærere, forskere og andre viden om literacy til gavn for den enkelte og samfundet.

Nationalt Videncenter for Læsning
Humletorvet 3
1799 København V
+45 41 89 90 90
info@videnomlaesning.dk

EAN 5798009882882
CVR 30891732

Aktuelt

Børnestavning og kunstig intelligens

I denne artikel kan du læse om, hvad kunstig intelligens har at tilbyde lærere og elever i børns første møde med skriftsprog i skolen. Vi tager et kig ind i maskinrummet i ATEL-projektet. ATEL står for Automated Tracking of Early Literacy.

For at få indblik i ATEL-projektets tekniske del er jeg på vej til Danmarks Tekniske Universitet (DTU). Målet med projektets tekniske del er at udvikle teknologi til en app, der skal hjælpe lærere med at give feedback på indskolingselevers tekster og tilrettelægge undervisning i tidlig skrivning. Jeg parkerer på Elektrovej, langt uden for min sprogpædagogiske komfortzone. Jeg skal møde lektor Michael Riis Andersen på instituttet DTU Compute i sektionen for kognitive systemer. Her sidder forskere og udvikler kunstig intelligens, som skal gøre livet lettere for alle os andre. Michael byder på kaffe på sit kontor og fortæller mig, at her på gangen udvikles alt fra teknologier til diagnosticering af epilepsi gennem elektroder til kortlægning af sociale netværk gennem vores mobiltelefoner. Han fortæller, at ”… omdrejningspunktet for sektionen er at trække information ud af data, vel at mærke brugbar information. Vi trækker brugbar information ud af for eksempel tekster, medicin, hjernen eller sociale netværk. Informationen kan bruges til at træne maskiner op til forskellige komplekse opgaver. Jeg har for eksempel kolleger, der arbejder på at udvikle censorer, som kan detektere sprængstoffer i lufthavnen og lignende.”

Michael er lidt af en pioner på sit område. Han er nemlig optaget af at hjælpe dansklærere i indskolingen, faktisk arbejder han med børns allerførste eksperimenter med skriftsproget, og den udfordring er Michael ret vild med: ”Jeg kan godt lide at lave projekter, der giver mening i en større skala. Og så er det her på grænsen af, hvad man kan med sprogteknologi, særligt i en dansk sammenhæng. Børns tidlige skrivning er en meget speciel type tekst at arbejde med i forhold til, hvad vi normalt ser inden for sprogteknologi.”

Jeg bliver nysgerrig på, hvad vi ‘normalt ser inden for sprogteknologi’, og Michael forklarer mig, at sådan noget som stavekontrol, tale-til-tekst og oversættelsesværktøjer for nylig har taget kvantespring. Jeg spørger ham, hvorfor teknologierne er blevet markant bedre over relativt kort tid. ”Det skyldes dels, at computere er blevet hurtigere, dels at der er meget større mængder af sproglige data at træne maskinerne med. For eksempel er der meget store datamængder i Wikipedia, som maskinerne kan arbejde med. Og på den baggrund opstår der en sneboldeffekt: Når vi har bedre maskiner, er der flere, der bruger dem, hvilket også genererer udvikling på feltet,” forklarer Michael. Så i dag kan computere for eksempel diktere almindeligt talt sprog meget præcist, mens danske børns spæde stave- og skriveforsøg stadig er et meget uudforsket område. Og børns tidlige skriftsprog er derfor noget af en udfordring for maskinlæringsdelen i ATEL-projektet. Sammen med sprogforskere fra Nationalt Videncenter for Læsning og Danmarks Institut for Pædagogik og Uddannelse arbejder Michael altså med at finde brugbar data at bygge kunstig intelligens til indskolingslæreren med. På DTU får Michael hjælp af kollegerne Lars Kai Hansen og Finn Årup Nielsen samt en hel del bachelor- og kandidatstuderende.

Hvordan lærer kunstig intelligens at vurdere elevers tekster?

Michael og hans kolleger skal som sagt udvikle en teknologi, der skal hjælpe lærere med at give feedback på indskolingselevers tekster og tilrettelægge undervisning i tidlig skrivning. Men hvordan kan maskinen lære at gøre netop det, som jeg bruger flere år på at uddanne lærerstuderende til at gøre, med blik for hver enkelt elevs læse- og skriveudvikling?

Sprogforskerne i ATEL-projektet har udviklet et meget nuanceret net af analytiske tilgange til elevernes tekster i sprogmodellen bag projektets maskinlæring, og den kunstige intelligens er blevet i stand til at vurdere staveforsøg, sætningsopbygning, men også beskrivere og struktur i elevernes tekster. Den kunstige intelligens repræsenterer på den måde et opdateret apparat til sprogbeskrivelse, som kan fange mange af de potentialer, der opstår i skriveundervisningen i en indskolingsklasse. Michael forklarer, hvordan han omsætter denne viden til maskinlæring: ”Sprogforskerne i projektet har udviklet en model til analyse af elevernes tekster i tre dimensioner: sætningskonstruktion, tekstkonstruktion og beskrivere. Hver af de tre dimensioner er relateret til forskellige kategorier, for eksempel hvilket grammatisk materiale der er brugt i tekster og sætninger. Sprogforskerne analyserer så et udvalg af elevernes tekster, som de scorer i alle kategorierne. Ud fra disse data kan maskinen lære, hvilke træk der er mest sandsynlige i en elevtekst, og der tegner sig en model for scoring af fremtidige tekster i maskinen. Ud over at lære gennem projektets indsamlede elevtekster, så træner man maskinen med allerede eksisterende samlinger af tekster og sprogbrug og forskernes lister over, hvad der kan optræde i denne type tekster.”

Michael uddyber: ”Sprogforskerne har scoret over 800 digitale børnestavede bøger. Jo flere elevtekster sprogforskerne kan score, jo bedre kan maskinens modeller blive. Maskinen kan så genkende forskernes træk i teksterne, men vi har også tilføjet mulige træk, som ikke optræder i datamaterialet. Vi har for eksempel brugt et værktøj til genkendelse af ordforråd, som er udviklet på Stanford Universitet og derefter videreudviklet på Københavns Universitet. Vi har brug for meget store mængder data at træne maskinen med, og det kan vi få med blandt andet dette værktøj, hvor en masse data allerede er registreret.”

På grænsen af moderne sprogteknologi

Man kan altså bruge allerede eksisterende sprogteknologiske værktøjer til at supplere datamaterialet i projektet. Og når man vil arbejde med alle lag i børns tekster, så arbejdes der på grænsen for, hvad der er muligt i moderne sprogteknologi. Michael uddyber: ”Det er nemmere at tage et værktøj ned fra hylden, når vi arbejder med teksttræk tæt på grammatikken. De mere semantiske kategorier og teksten som helhed har været sværere at arbejde med. Nogle enkelte træk har vi måttet udelade. For eksempel kan maskinen ikke lære at score tekstbånd.” Michael giver et eksempel: ”Hvis et barn skriver: ’Han har scoret et mål. Det var en rigtig god kasse’, så kræver det en meget dyb forståelse i maskinen at registrere sammenhængen mellem ordene mål og kasse i sætningen. Det vil sige, at maskinen ikke kan fortælle læreren, at her har eleven skabt en sammenhæng, et såkaldt tekstbånd, i sin sætningsopbygning.” Til gengæld kan maskinen godt lære at score udtryk for positive og negative følelser i elevernes tekster, fordi man allerede har udviklet modeller til dette i forbindelse med sprogbrugen på sociale medier. Som Michael forklarer det: ”Der er allerede en opskrift for at designe sådant et system.”

Hvor pålidelig er maskinen?

En af Michaels faglige kæpheste er statistik usikkerhed. Kan vi regne med maskinens forudsigelser? Maskinen udvikles løbende ved at sammenligne sprogforskernes scoringer af elevers tekster med maskinens, og Michael konkluderer: ”Maskinen er ikke perfekt, men de fleste scoringer er gode nok til, at vi kan bruge dem.”

”Når det gælder sætningskonstruktion, så rammer maskinen plet næsten hver gang. Maskinen kan altså for eksempel meget nøjagtigt vurdere, om en tekst indeholder ledsætninger, eller om barnet kan variere starten af sine sætninger (forfeltet) eller altid sætter subjektet i starten af sætningen.”

Lidt mere upålideligt bliver det, når maskinen skal kategorisere beskrivende udtryk i elevernes tekster, såsom en flyvende tallerken. Maskinen matcher sprogforskernes analyser i 74 % af tilfældene, når det således gælder ”beskrivere” i elevteksterne, for eksempel formuleringer med prædikater, beskrivende adjektiver og adverbier.

Men Michael understreger, at dette tal gælder, når vi kun matcher én af elevernes tekster med forskernes analyse. Når eleven skriver flere tekster i appen, bliver maskinens vurdering mere pålidelig. Jeg spørger, hvor mange tekster vi skal sætte den enkelte elev til at skrive i appen, før læreren kan bruge maskinens vurderinger i sit arbejde? ”Det er vi først nu ved at undersøge, men jeg vil skyde på, at to tekster om året er for lidt, mens 20 tekster formentlig vil give et godt billede af elevens skriveudvikling,”svarer Michael, men han vil helst ikke hænges op på de tal endnu.

Hvorfor bruge kunstig intelligens i pædagogisk arbejde?

Til slut vender jeg tilbage til min skepsis over for maskinens overtagelse af varme hænders arbejde. Hvad har kunstig intelligens at tilbyde indskolingslærerens skriveundervisning? Michael peger på, at maskiner er mere stabile end mennesker: ”Maskiner kan ikke sove dårligt. Mennesker bliver trætte, laver fejl og kan kun analysere så og så mange tekster. Maskinen kan bearbejde store datamængder og tilbyde læreren idéer til feedback og differentieret skriveundervisning. Hvis vi kan overlade noget analysearbejde til maskinen, så kan den kunstige intelligens støtte lærerens arbejde, men den kan naturligvis ikke erstatte læreren.” Jeg spørger, om maskiner også har den fordel, at de ikke har fordomme. Men Michael siger, at det kan de faktisk godt have: ”Det skal forstås på den måde, at maskinen lærer de mønstre, der er i det datamateriale, som er blevet brugt til at træne modellen, og hvis dette data er ”fyldt med fordomme”, så kan det i princippet blive gentaget af maskinen. Så det er også noget, vi skal være opmærksomme på.”

Hjemme på kontoret spørger jeg også sprogforsker i projektet Jesper Bremholm, om der er sprogpædagogiske faldgruber, når vi inddrager kunstig intelligens i arbejdet med feedback og differentiering i skolen: ”Det er selvfølgelig afgørende, at den kunstige intelligens bliver brugt på måder, der er en støtte og en hjælp for læreren i udøvelsen af sit daglige arbejde i klasserummet. Skræmmebilledet er en teknologi, der fratager eller underminerer lærerens professionelle dømmekraft og didaktiske omtanke. Det kunne for eksempel ske, hvis man med en teknologi som ATEL’s valgte at angive vurderingen af elevernes skriftlige produkter gennem en talværdi og nogle forsimplede kategorier som for eksempel ”usikker skriver”, ”middel skriver” og ”over middel skriver” uden nærmere information om, hvad de enkelte kategorier dækker over. Det kunne indebære en risiko for, at læreren ureflekteret satte nogle prædikater på eleverne uden dybere forståelse for, hvad de dækker over. I ATEL-projektet har vi været meget optagede af at undgå scenarier som dette. Derfor bruger vi teknologien til at give læreren en nuanceret feedback om elevernes udvikling som skrivere, og på den måde sigter vi på at gøre læreren klogere og bedre rustet til at planlægge og varetage en differentieret skriveundervisning i sin klasse.”

Næste skridt i ATEL-projektet er at integrere maskinens kunstige intelligens i appen, og i løbet af foråret vil en lille gruppe lærere afprøve værktøjet, som altså skal hjælpe læreren med at få øje på vækstpunkter i elevernes skriftsproglige produkter og give støtte til elevrespons og konkrete didaktiske forslag til undervisning, der kan støtte elevernes fortsatte udvikling som skrivere."

Vil du vide mere om projektet, så meld dig til konference d. 26. april 2023, hvor forskerne præsenterer hele det tværvidenskabelige og banebrydende projekt på DPU i København. Program og tilmelding finder du her

  • Læs mere her

    Film

    Forskningsprojekt om børns tidlige skriveudvikling. Se filmen her.

    Rapporter

    Bremholm, J., Kabel, K., Bundsgaard, J., & Berthelsen, U. D. (2020 DPU, Aarhus Universitet.) Manual for analytisk kodning af elevtekster.

    Kabel, K., Bremholm, J., Bundsgaard, J., & Berthelsen, U. D. (2020). DPU, Aarhus Universitet. Elevers tidlige skriveudvikling: Identificerede trin.

    Kabel, K., Berthelsen, U. D., Bremholm, J., & Bundsgaard, J. (2019).  DPU, Aarhus Universitet. Teoretisk arbejdspapir: Analysemodel til scoring af elevtekster.

    Artikler

    Bundsgaard, J., Kabel K., & Bremholm, J. (2022). Skriveudvikling i de tidlige skoleår. Læsepædagogen, nr. 3, 23-30.

    Bundsgaard, J., Bremholm, J., & Kabel, K. (2022). Sådan udvikler børn sig skriftsprogligt. Sprog og Samfund40(2), 18-20.

    Videnskabelige artikler

    Bremholm, J., Kabel, K., Liberg, C., & Skar, G. (2022). A review of Scandinavian writing research between 2010 and 2020. Writing & Pedagogy, 13(1), 7-49.

    Kabel, K., Bremholm, J., & Bundsgaard (2022). A framework for identifying early writing development. Writing & Pedagogy, 13(1), 51-87.

    Bundsgaard, J., Kabel, K., & Bremholm, J. (2022). Validating scales for early writing development. Writing & Pedagogy, 13(1), 89-120.

    Bremholm, J., Bundsgaard, J., & Kabel, K. (2022). Proficiency scales for early writing development. Writing & Pedagogy, 13(1), 121-154.

Del siden på email

Du deler et link til siden: Børnestavning og kunstig intelligens