6G Masteruppsats: Resurseffektiva stora språkmodeller i kantnätverk
Diarienummer | |
Koordinator | RISE Research Institutes of Sweden AB - RISE AB - Digitala System |
Bidrag från Vinnova | 100 000 kronor |
Projektets löptid | januari 2025 - juni 2025 |
Status | Pågående |
Utlysning | 6G - Kompetensförsörjning |
Ansökningsomgång | 6G - Handledning av examensarbete |
Syfte och mål
Projektets övergripande syfte är att utveckla beräkningseffektiva stora språkmodeller (LLMs) för användning i resursbegränsade 6G-edge-miljöer. Målet med detta examensarbete är därför att utforska energieffektiva transformerbaserade språkmodeller genom att nyttja avancerade tekniker som kunskapsdistillation och modellkvantisering.
Förväntade effekter och resultat
Förväntade resultat från projektet inkluderar en jämförelse baserad på numeriska experiment mellan en ny alternativ arkitektur och konventionella transformermodeller. I ett större perspektiv har projektet potential att bidra till förbättrad beräkningseffektivitet och mer hållbara AI-tjänster i 6G-edge-miljöer.
Planerat upplägg och genomförande
Projektet kommer att genomföras i flera steg. Först utför studenten en litteraturstudie för att förstå befintliga tekniker och modeller. Därefter genomför studenten praktiska experiment för att träna och optimera nya beräkningseffektiva språkmodeller. Dessa jämförs med konventionella transformermodeller genom numeriska experiment. Slutligen analyseras och dokumenteras resultaten, och metoder och resultat görs tillgängliga som öppen källkod.