A Sovereign AI Stack for Portable European Cloud Services
Diarienummer | |
Koordinator | RISE Research Institutes of Sweden AB - RISE AB - Digitala System |
Bidrag från Vinnova | 1 997 349 kronor |
Projektets löptid | november 2023 - maj 2025 |
Status | Pågående |
Utlysning | Avancerad digitalisering - Möjliggörande tekniker |
Ansökningsomgång | AI för avancerad digitalisering, 2 |
Syfte och mål
Vi skapar en suverän, hårdvaruagnostisk AI-stack för molntjänster för Sverige och EU. Driven av LLM:er och kompatibel med flera AI-acceleratorer, hjälper den molntjänstoperatörer att optimera för prestanda, pris, och leverantörskedjesuveränitet. Vår testbädd identifierar, utvärderar, och förfinar AI-ramverk för att stödja flera plattformar för konkurrenskraftiga inhemska AI-värdar med robust datasäkerhet. Strategiskt skyddar den mot leverantskedjeflaskhalsar genom minskat beroendet på enskilda leverantörer.
Förväntade effekter och resultat
Säkrar och bygger kompetens genom en testbädd för samutvärdering av AI/ML-stackar, AI-acceleratorer, och LLM:er med hänseende till teoretisk maxprestanda och förmåga att nå användningsfallskrav. Säkrar och bygger lösningar genom att använda testbädden för att utveckla förbättrade AI-stackar som breddar stöd och optimering till fler AI-acceleratorer och -ramverk och som möjliggör för svenska molntjänstleverantörer att fritt välja bland nuvarande och framtida GPU- och AI-acceleratorleverantörer.
Planerat upplägg och genomförande
Utveckla en molntjänstorienterad och helt hårdvaruagnostisk mjukvarustack som flyttar hårdvaruspecifika optimeringar nära hårdvaran, och riktar sig mot de mest lovande ramverken och acceleratorerna identifierade på testbädden. Stacken kommer valideras med LLM-inferens för att säkerställa att hårdvaruagnostiska optimeringar (alternativa kodningar, gleshet, kvantifiering) appliceras portabelt för flera AI-acceleratorer och att kod med hög prestanda genereras för samtliga stödda AI-acceleratorer.