Kunskapsbaserade system inom bioinformatik
Kursplan, Avancerad nivå, 1MB416
- Kod
- 1MB416
- Utbildningsnivå
- Avancerad nivå
- Huvudområde(n) med fördjupning
- Bioinformatik A1N, Teknik A1N
- Betygsskala
- Med beröm godkänd (5), Icke utan beröm godkänd (4), Godkänd (3), Underkänd (U)
- Fastställd av
- Teknisk-naturvetenskapliga fakultetsnämnden, 27 april 2012
- Ansvarig institution
- Institutionen för biologisk grundutbildning
Behörighetskrav
120 hp inklusive Bioinformatisk metodik, Sannolikhet och statistik, Programmeringsteknik II och Databasteknik I.
Mål
Kursen syftar till att ge kunskap och förståelse för hur logik-baserade metoder kan användas för att stödja konstruktion av kunskapsbaserade system inom livsvetenskaperna med utgång i stora mängder av data såsom t.ex. genexpressions-, molekylära interaktions-, annotationsdata och kombinationer av kliniska och genomiska data. Kursen skall skapa en fördjupad förståelse för hur avancerade lärande system kan användas för att lösa bioinformatiska problem.
Efter godkänd kurs skall studenten kunna
- använda och beskriva definitioner och matematisk notation för information - och beslutssystem, rough sets samt regelsystem
- använda andra metoder för maskininlärning såsom klustring och beslutsträd, samt sätta dessa i relation till regelbaserade metoder
- tillämpa kunskaper inom regelsystem och Monte Carlo-baserade egenskapsselektion för att formulera och lösa klassifikationsproblem inom livsvetenskaperna
Innehåll
Introduktion till booleska funktioner. Transformation och förenkling av booleska uttryck. Information, beslutsystem och rough sets. Egenskaper och dess syntes och urval. Träning och validering av modeller. Statiska egenskaper av modeller. Exempel av tillämpningar inom livsvetenskaperna inkluderar: klassificering med hjälp av expressionsdata, prediktering av genfunktion från expressionstidsprofiler och genomiska databaser, modellering av transkriptionsmekanismer, ligandreceptor bindningar, drogresistens, prediktering av proteinfunktion från struktur och modellering med hjälp av kliniska och genomiska data. Föreläsningarna varvas med datorlaborationer med verkliga och syntetiska data. Ontologier. Pubmed. Maskininlärning: klustring, rough sets och beslutsträd, Monte Carlo-baserad egenskapsselektion, statistisk modellgiltighet och signifikans.
Undervisning
Föreläsningar, datorövningar, projekt och inlämningsuppgifter.
Examination
Skriftligt prov vid kursens slut (3 hp). Inlämningsuppgifter (1 hp) och projekt (1 hp).