Regeringen skal sætte fart på dansk AI-sprogmodel
Det er udtryk for mangel på visioner, når regeringen hidtil har afvist forslaget om at udvikle en dansk GPT-sprogmodel som et troværdigt og sikkert alternativ til ChatGPT og tilsvarende modeller fra de amerikanske techgiganter.
Ser vi på vore nordiske naboer, er de anderledes fremsynede. I Sverige har forskere udviklet GPT-SW3. I Norge er man i fuld gang med at færdiggøre Nor GPT-23B, og i Finland har de FinGPT. Alle tre er AI-sprogmodeller i stil med ChatGPT – blot i mindre og tilpasset skala.
Ingen kan være i tvivl om, at sprogmodeller bliver en grundpille for internettets infrastruktur i de kommende år. Derfor handler det om at tage ejerskab over fremtiden. Og derfor bør det have topprioritet for regeringen at tage ansvar for den digitale infrastruktur, så vi opnår indflydelse på udviklingen og kvaliteten af AI-modeller herhjemme.
De manglende ambitioner hos regeringen stod lysende klart i februar, da et beslutningsforslag fra SF om at medfinansiere en dansk AI-sprogmodel med 40 millioner kroner blev skudt ned i folketingssalen. I forslaget hedder det, at »vi nationalt bør arbejde for at være uafhængige af udenlandske kommercielle interesser og have fokus på datasikkerhed, transparens og dansk indhold i en dansk sprogmodel«. Forslaget fik opbakning fra blandt andre De Konservative og Alternativet, og sagen skal behandles af digitaliseringsudvalget igen 8. maj.
Forhåbentlig er tanken om en dansk sprogmodel til den tid modnet hos regeringspartierne, for vi skal op i tempo, og det kræver politisk og økonomisk understøttelse, hvis vi skal udvikle en stærk, national sprogmodel i samarbejde mellem universiteter, myndigheder og private virksomheder til gavn for hele samfundet.
Mange virksomheder og organisationer er allerede i fuld gang med at udforske potentialet med ChatGPT og Copilot, som bliver en gamechanger på stort set alle områder af samfundet lige fra sundhedsvæsen til produktionsvirksomheder. Men vi risikerer at gentage fortidens fejl, hvis vi knytter vores infrastruktur til udenlandske sprogmodeller, hvor vi ikke har indflydelse på afgørende parametre som datasikkerhed, ophavsret og troværdighed – og ikke har skyggen af indsigt i de data, den er bygget på.
En dansk sprogmodel bygget på open source og med data af høj kvalitet vil omvendt sikre fuld åbenhed, så den kan være byggesten for en række AI-projekter både i den offentlige sektor og for private virksomheder. Den vil ikke være forurenet af bias eller fejlagtigt indhold, som får de populære modeller som ChatGPT, Bard og Copilot til at opdigte svar, fordi de henter deres data fra noget nær det samlede internet.
Samtidig kan vi med en styret sprogmodel undgå at krænke ophavsretten, som er fokus for flere store retssager i USA med New York Times som den mest prominente sagsøger mod OpenAI.
Netop kvaliteten af de data, som sprogmodellen fodres med, er afgørende for at kunne anvende den som et troværdigt værktøj til forskning og uddannelse og til sagsbehandling i den offentlige sektor. På Københavns Professionshøjskole har man for små midler udviklet modellen SkoleGPT, som er et forsøg på at skabe en open source, gratis og sikker generativ AI, der kan bruges af skolelærere i undervisningen. SkoleGPT er på den måde en tryg sandkasse, hvor man som lærer kan arbejde med GPT som læringsværktøj og tage de kritiske dialoger med eleverne om brugen af AI.
Ligesom Norge, Sverige og Finland er vi som et lille land nødt til at investere i nationale AI-løsninger for at fastholde vores kulturelle og sproglige identitet og værdier i en digital tidsalder. Det handler om at demokratisere teknologien, så vi opnår præcis og målrettet sprogmodel, der kan benyttes af alle, som vil udvikle nye applikationer og smarte løsninger oven på.
Sidst men ikke mindst ligger der et væsentligt element af suverænitet i at bygge vores egen sprogmodel og tage kontrol med teknologien på egne præmisser som et fælles samfundsgode. Det virker besynderligt, at regeringen på den ene side ønsker strammere regulering af techgiganter som Google, Meta og X, men på den anden side vil risikere at gøre os afhængige af selv samme techvirksomheder, når det gælder AI.
Indvendingerne fra regeringspartierne er, at det er dyrt at indsamle data, træne og ikke mindst vedligeholde en dansk model, og at den løbende skal opdateres i årene fremover. Det er sandt. Men vi har ikke råd til at lade være, og investeringen vil tjene sig ind på andre fronter. Samtidig opnår vi uvurderlig viden og knowhow på et område, der vil få enorm samfundsmæssig betydning fremover.