Du har inte javascript påslaget. Det innebär att många funktioner inte fungerar. För mer information om Vinnova, ta kontakt med oss.

Överbrygga klyftan mellan det naturliga språket och strukturerade datamängder

Diarienummer
Koordinator Starcounter AB
Bidrag från Vinnova 972 734 kronor
Projektets löptid september 2023 - maj 2024
Status Avslutat
Utlysning Framväxande tekniklösningar
Ansökningsomgång Framväxande tekniklösningar steg 1 2023

Viktiga resultat som projektet gav

Starcounters team har validerat hypotesen om att en modifierad stor språkmodell kan översätta meningar i naturligt språk till Starcounter´s datamodell för att utföra numeriska operationer, dvs att skapa korrekta databasfrågor utan särskild kompetens kring hur sådana frågor ställs eller kompetens kring datamodellen som används. Vi ser att de resultat som producerades är starka indikationer om att detta är genomförbart.

Långsiktiga effekter som förväntas

Resultatet av projektet var en Proof-of-Concept implementation som från naturligt språk kan producera databasfrågor i Starcounters datamodell. Kvalitéten på de producerade databasfrågorna gjorde att vi valt att vidareutveckla denna teknologi. Projektet har givit goda indikationer för att denna innovation kan öppna vägen för att förändra hur företagsprogramvara kan användas och anpassas till ökande behov.

Upplägg och genomförande

Starcounter började med att skapa ett diversifierat dataset och genomförde en serie experiment med både externa API-baserade språkmodeller och våra egna, lokalt tränade modeller, som baseras på CodeLlama, Llama3 och OpenCodeInterpreter. Vi tillämpade olika moderna tekniker inom LLM för att uppnå effektiv och generaliserad inlärning av vårt paradigm. Dessa modeller testades för att generera strukturerade datarepresentationer i vårt domänspecifika språk, som mappas mot vår datamodell. Modellerna uppnådde en hög nivå av precision på våra benchmarks och utvärderingar.

Externa länkar

Texten på den här sidan har projektgruppen själv formulerat. Innehållet är inte granskat av våra redaktörer.

Senast uppdaterad 21 juni 2024

Diarienummer 2023-01407