Federerad Tabular Datasyntetisering - Ett samarbete mellan banker
Diarienummer | |
Koordinator | Lindholmen Science Park AB |
Bidrag från Vinnova | 1 999 964 kronor |
Projektets löptid | januari 2023 - april 2025 |
Status | Pågående |
Utlysning | Avancerad digitalisering - Möjliggörande tekniker |
Ansökningsomgång | Avancerad och innovativ digitalisering 2022 |
Viktiga resultat som projektet gav
Projektet har haft två mål:1. Generera syntetisk data med hög fidelitet.2. Utforska federerad modellträning mellan banker. Vi har utvecklat ett open source-verktyg för att skapa syntetiska transaktionsnätverk, anpassade efter verklig data eller kända prestandamått. Detta möjliggör systematiskt arbete för att förbättra anti-penningtvätt. Verktyget har använts för federerad inlärning mellan två banker. Även om resultaten hittills är begränsade har projektet lagt en viktig grund för vidare studier.
Långsiktiga effekter som förväntas
I dag är förmågan att upptäcka penningtvätt begränsad. i) Banker samarbetar sällan och har olika riskstrategier, vilket ger olika metoder. ii) Tillsynsmyndigheter saknar verktyg för att bedöma effektivitet – sanktionsavgifter rör nästan enbart KYC. Med syntetisk data kan banker och myndigheter diskutera transaktionsövervakning på en gemensam, icke-känslig grund. Det kan bli en nyckel till ökad samverkan.
Upplägg och genomförande
Projektet har drivits genom veckovisa möten för att följa upp framsteg och lösa frågor. AI Sweden har lett utvecklingen av datageneratorn i nära samarbete med bankerna, som bidragit med domänkunskap. Vid större utmaningar har vi hållit workshops för djupare diskussioner. Federerad inlärning (FL) har utvecklats i samverkan mellan bankernas data science-, IT- och innovationsgrupper för att möta tekniska och säkerhetskrav. Vi har även samarbetat med Scaleout AB, en startup med fokus på (FL).