Basprojekt för utvecklandet av nästa generations multimodala storskaliga svenska språkmodeller
Diarienummer | |
Koordinator | Lindholmen Science Park AB - AI Sweden |
Bidrag från Vinnova | 4 995 566 kronor |
Projektets löptid | januari 2024 - december 2024 |
Status | Avslutat |
Viktiga resultat som projektet gav
Projektet syftade till att utveckla en generell multimodal storskalig generativ språkmodell för det svenska språket. Alla delmål som täckts av finansieringen fas 1 har uppnåtts: vi har etablerat ramverk och processer för datahantering, vi har utvecklat ramverk och arkitektur för multimodala modeller, vi har sammanställt den hittills största datamängden för träning av svenska språkmodeller, och vi har tränat en ljud-text-modell som ett första exempel på hur en multimodal svensk modell kan fungera.
Långsiktiga effekter som förväntas
En transparent utvecklingsprocess och dialog med upphovsrättsägare kring ansvarsfulla sätt kan arbeta med data för utvecklandet av svenska språkmodeller. Vår ambition har varit att erbjuda ett nationellt alternativ till att använda utländska APIer i form av öppna modeller, och i samband med detta stärka svensk resiliens genom kompetens-, infrastruktur- och resursuppbyggnad. Projektet har lett till följdprojekt, varit värdefullt för att stärka det nordiska samarbetet kring språkmodeller, vilket vi hoppas kommer leda till samarbeten och värdeskapande på nordisk nivå.
Upplägg och genomförande
Projektet var ursprungligen planerat att genomföras i tre faser, med kontroll- och beslutspunkter mellan varje fas. Kontrollpunkterna baserades på de KPIer som definierades för varje fas i ansökan. Projektet hann genomföra den första fasen och uppnådde alla sina KPIer under denna, men finansieringen för de fortsatta två faserna uteblev.