Mångfasetterad djupinlärning för genomik och multiomik

Portrait of Carl Nettelblad

Namn: Carl Nettelblad

Projekttitel: Mångfasetterad djupinlärning för genomik och multiomik

Institution: Institutionen för informationsteknologi

Forskningsområde: Beräkningsvetenskap

Projektsammanfattning

Neurala nätverk har visat sig vara oerhört framgångsrika på att analysera bilder, video och textdata. Men än så länge har framgångarna varit mer begränsade för genomiska data. Tillsammans med min forskarstuderande har jag skapat nya anpassade nätverk för genomiska data. Hittills har vi applicerat dessa på frågor kring populationsgenetik, och har därmed visat hur de kan lära sig att identifiera individers geografiska ursprung med större noggrannhet än den gängse metoden med principalkomponentanalys (PCA). Det som dock är mest spännande med dessa nätverk är att de är allmänna.

Inom traditionell bioinformatik kräver varje datatyp och varje problemformulering helt unika algoritmer, men exemplen från bildanalysen visar hur transfer learning kan användas för att anpassa ett nätverk till ett nytt problem. Under året kommer vi att undersöka hur grundläggande nätverksdesign kan anpassas för att besvara olika genomiska frågor och även inkludera proteomiska och transkriptomiska data.

Vad ser du fram emot mest under ditt sabbatsår?

Jag ser fram emot de nya forskningsidéer och förnyade förhållningssätt till befintliga idéer som kommer att möjliggöras i en verkligt tvärvetenskaplig miljö.

Två diagram. Ett som visar PCA (principle component analysis) av populationer där prickar som representerar populationer är spridda längs två linjer, den ena nästan lodrät och den andra sluttande åt höger, som möts nära x-axeln. Det andra diagrammet visar populationer analyserade med en autokodare. Här är prickarna grupperade på ett sätt som liknar populationernas geografiska utbredning.
PCA-clustering av populationer (upptill) jämfört med den som utförts av vår autokodare (nedtill).

Senast uppdaterad: 2021-02-04