Text mining som redskap vid cancerriskbedömning

Diarienummer
Koordinator Karolinska Institutet - Institutet för miljömedicin
Bidrag från Vinnova 2 524 000 kronor
Projektets löptid december 2011 - december 2015
Status Avslutat

Syfte och mål

Projektet avsåg att utveckla en ny metod för att bedöma kemikaliers cancerrisker samt att identifiera carcinogena verkningsmekanismer. Denna metod baseras på text mining. Vi har i detta projekt utvecklat ett fritt tillgängligt text mining-baserat verktyg för cancerriskbedömning av kemikalier. Inom projektet har vi förutom metodutveckling publicerat flera artiklar som visar hur metoden kan användas för hälsoriskbedömning och som en metod för att öka den mekanistiska förståelsen om hur kemikalier orsakar cancer. Därmed har båda projektmålen uppfyllts.

Resultat och förväntade effekter

Verktyget kan användas vid kemikalieriskbedömning men även som ett verktyg för forskning. Verktyget använder redan publicerad litteratur vilket gör det möjligt att nyttja redan genomförd forskning för att ta fram ny kunskap. Genom att klassificera stora mängder text kan mönster i data identifieras och viktiga kunskapsluckor upptäckas. Grupper av kemikalier kan jämföras med varandra för att upptäcka viktiga likheter eller skillnader. Metoden är även användbar som hypotesskapande som grund för experimentella studier.

Upplägg och genomförande

Verktyget har utvecklats i samarbete mellan forskare vid Institutet för Miljömedicin, Karolinska Institutet och Computer Laboratory, University of Cambridge, UK. Verktyget är uppbyggt kring en cancerriskbedömnings-taxonomi som bl.a. strukturerar de biologiska mekanismer som är relevanta för cancerutveckling. Arbetet har bl.a. involverat manuell annotering av vetenskaplig litteratur, maskininlärning och tekniker för text-zoning. Vi har även successivt ökat användarvänligheten av verktyget med exempelvis automatisk statistik och direkt-länk till sökmotorn PubMed.

Externa länkar

Texten på den här sidan har projektgruppen själv formulerat. Innehållet är inte granskat av våra redaktörer.