Du har inte javascript påslaget. Det innebär att många funktioner inte fungerar. För mer information om Vinnova, ta kontakt med oss.

Överbrygga fysikforskning till verkliga tillämpningar med data science på scientifyRESEARCH

Diarienummer
Koordinator Scientify Research Solutions AB
Bidrag från Vinnova 500 000 kronor
Projektets löptid december 2022 - maj 2023
Status Avslutat
Utlysning MSCA Employment
Ansökningsomgång Attrahera integrera och behålla internationell spetskompetens 2022 ht

Viktiga resultat som projektet gav

Projektet "Bridging physics research to real-life applications with data science at scientifyRESEARCH" är ett samarbete mellan företaget scientifyRESEARCH och Marie Cure PhD-forskaren Smita Chakraborty. Projektet har två huvudmål. En, för företaget, är att använda skalproduktion av vår forskningsfinansieringsdatabas med maskininlärning och naturlig språkbehandling. Det andra målet för kandidaten är att ge kandidaten överförbara färdigheter och erfarenheter som lätt kan kännas igen av industrin i Sverige och utanför.

Långsiktiga effekter som förväntas

Projektet "Bridging physics research to real-life applications with data science at scientifyRESEARCH" nådde sina mål genom att det utgjorde grunden för scientifyRESEARCH att skala sin innehållsproduktion med maskininlärning och naturliga språkbehandlingstekniker. För kandidaten gav projektet Smita Chakraborty möjligheten att lära av en verklig expert inom ML/NLP/AI. Smita var fördjupad i Microsoft Azure som utvecklingsplattform, ett annat verktyg som används flitigt inom industrin, och som lägger till meriter till hennes anställningsbarhet inom industrin.

Upplägg och genomförande

Projektet innebar att använPythonhon, ML/NLP för att bearbeta ett stort dataset till en forskningsfinansieringsdatabas. Utformningen och genomförandet av projektet inkluderar: 1. Datainsamling: Automatisera processen för att hämta data från en stor nationell finansiärs databas. 2. Databearbetning: XML-fildata matas in i en ren pythondataram. 2. NLP: Vi testade flera stora språkmodeller och bestämde oss för att använda NLP från OpenAI. 3. Datavisualisering: data presenteras visuellt på webbplatsen scientifyRESEARCH.org som berikad finansieringsinformation.

Externa länkar

Texten på den här sidan har projektgruppen själv formulerat. Innehållet är inte granskat av våra redaktörer.

Senast uppdaterad 15 juli 2023

Diarienummer 2022-02955