Överbrygga klyftan mellan det naturliga språket och strukturerade datamängder
Diarienummer | |
Koordinator | Starcounter AB |
Bidrag från Vinnova | 972 734 kronor |
Projektets löptid | september 2023 - maj 2024 |
Status | Avslutat |
Utlysning | Framväxande tekniklösningar |
Ansökningsomgång | Framväxande tekniklösningar steg 1 2023 |
Viktiga resultat som projektet gav
Starcounters team har validerat hypotesen om att en modifierad stor språkmodell kan översätta meningar i naturligt språk till Starcounter´s datamodell för att utföra numeriska operationer, dvs att skapa korrekta databasfrågor utan särskild kompetens kring hur sådana frågor ställs eller kompetens kring datamodellen som används. Vi ser att de resultat som producerades är starka indikationer om att detta är genomförbart.
Långsiktiga effekter som förväntas
Resultatet av projektet var en Proof-of-Concept implementation som från naturligt språk kan producera databasfrågor i Starcounters datamodell. Kvalitéten på de producerade databasfrågorna gjorde att vi valt att vidareutveckla denna teknologi. Projektet har givit goda indikationer för att denna innovation kan öppna vägen för att förändra hur företagsprogramvara kan användas och anpassas till ökande behov.
Upplägg och genomförande
Starcounter började med att skapa ett diversifierat dataset och genomförde en serie experiment med både externa API-baserade språkmodeller och våra egna, lokalt tränade modeller, som baseras på CodeLlama, Llama3 och OpenCodeInterpreter. Vi tillämpade olika moderna tekniker inom LLM för att uppnå effektiv och generaliserad inlärning av vårt paradigm. Dessa modeller testades för att generera strukturerade datarepresentationer i vårt domänspecifika språk, som mappas mot vår datamodell. Modellerna uppnådde en hög nivå av precision på våra benchmarks och utvärderingar.