Automatisk, algoritmbaserad bildigenkänning

Diarienummer 2014-04820
Koordinator MOSTPHOTOS AB
Bidrag från Vinnova 880 500 kronor
Projektets löptid november 2014 - oktober 2015
Status Avslutat

Syfte och mål

Syftet med vårt projekt var att göra det enklare och mer skalbart för både en bildbyrå och fotografer att sälja stora volymer av bilder, genom att ta fram datorsystem för bildigenkänning som effektiviserar intaget av nya bilder i ett bildarkiv. Med projektet, har vi uppfyllt det viktiga delsteget att automatisera bedömningen av huruvida modellkontrakt behövs eller inte på bilder med människor.

Resultat och förväntade effekter

Mostphotos ser ut att bli först med att använda bildigenkänningsteknologi för ändamålet att bedöma behov av modellkontrakt på bilder. Det är en betydande pusselbit för att uppnå vårt mål att förenkla för privatpersoner och fotografer att sälja bilder. Det innebär betydande kostnadsbesparingar i form av minskade behov för manuell granskning men även bättre möjligheter att ta in större volymer av bilder till vårt bildarkiv. Vi utesluter heller inte att licensiera ut tekniken till andra aktörer.

Upplägg och genomförande

Vi har använt en modell kallad Convolutional Neural Networks (CNN) för klassificering, lokalisering och detektion av objekt på bilder. Vidare har vi använt s.k. deep learning-metoder för att optimera systemets förmåga att lokalisera objekt och känna av dess gränser. CNNs har visat sig överlägsna andra modeller framför allt vad gäller klassificering av objekt, där modellen t.o.m. presterat bättre än det mänskliga ögat. Vi har vidare använt ett antal hundratusen bilder från Mosphotos bildbank för att träna och testa systemet på.

Texten på denna sida har projektgruppen själv formulerat och innehållet är ej granskat av våra redaktörer.