Svenskt Språkdatalabb

Diarienummer
Koordinator LINDHOLMEN SCIENCE PARK AKTIEBOLAG - LINDHOLMEN SCIENCE PARK AKTIEBOLAG, Göteborg
Bidrag från Vinnova 1 891 095 kronor
Projektets löptid juni 2019 - juni 2021
Status Pågående
Utlysning Datadriven innovation
Ansökningsomgång Datalabb och datafabrik som nationell resurs

Syfte och mål

Projektet ska genom samverkan med ledande aktörer inom NLP samt behovsägare ta fram svenska referensdataset och modeller för Natural Language Processing (NLP) och tillgängliggöra dessa med öppen access i AI Innovation of Swedens datafabrik. Projektet kommer också inkludera förstudier för vidare projekt inom domänspecifik text och förtränade modeller.

Förväntade effekter och resultat

Det finns idag få svenska dataset som är licensierade på ett sätt som främjar användning, i synnerhet kommersiell sådan, och projektet ska därför skapa en infrastruktur för svenska dataset, där annoterad data och färdigtränade modeller tillgängliggörs. Detta kommer att bidra till innovationer och tillämpningar baserad på svensk data för svenska samhällsaktörer, myndigheter, akademi och industri.

Planerat upplägg och genomförande

I projektets inledande steg kommer en svensk datamängd tas fram genom att tillgängliggöra och använda befintliga textdatamängder och annotera dessa med avseende på entitetstaggning och sentimentanalys. Text och modeller kommer också att analyseras utifrån ett dialogperspektiv. Parallellt kommer också bakgrundstränade modeller tas fram för skärmad data och tillgängliggöras i datalabbet. Projektet inkluderar också förstudier för tillämpningen av domänspecifik text.

Texten på den här sidan har projektgruppen själv formulerat. Innehållet är inte granskat av våra redaktörer.

Senast uppdaterad 24 maj 2019

Diarienummer 2019-02244

Statistik för sidan