Komplexa data - analys och visualisering
Kursplan, Avancerad nivå, 1MB525
Kursen är avvecklad.
- Kod
- 1MB525
- Utbildningsnivå
- Avancerad nivå
- Huvudområde(n) med fördjupning
- Bioinformatik A1N, Teknik A1N
- Betygsskala
- Med beröm godkänd (5), Icke utan beröm godkänd (4), Godkänd (3), Underkänd (U)
- Fastställd av
- Teknisk-naturvetenskapliga fakultetsnämnden, 7 mars 2011
- Ansvarig institution
- Institutionen för biologisk grundutbildning
Behörighetskrav
120 hp inklusive Beräkningsvetenskap II alternativt genomgången årskurs ett inom masterprogrammen Molekylär bioteknik eller Bioinformatik.
Mål
Kursen syftar till att ge kunskap om analys och visualisering av komplexa multidimensionella data.
Efter godkänd kurs ska studenten kunna
- tillämpa avancerade moderna metoder för oövervakad explorativ modellering.
- tillämpa avancerade moderna metoder för övervakad modellering.
- tillämpa övergripande algoritmiska modelleringstekniker.
- självständigt välja lämpliga metoder för givna biologiska/biomedicinska data och frågeställningar.
- kritiskt analysera, värdera och sammanställa biologiska/biomedicinska resultat baserat de modeller som skapas från komplexa datamängder.
Innehåll
Kursen behandlar analys och visualisering av komplexa multidimensionella data där insamlade mätvärden för en observation kan bestå av en kombination av olika kvalitativa och kvantitativa variabler som oftast kommer med tillhörande mätosäkerheter (teknisk variation), ibland är helt okända (missing data), och ibland är censurerade (p.g.a. detektionströsklar och/eller mättnadseffekter i mätinstrument).
(1) Oövervakad explorativ modellering: Komprimering och visualisering i form av t.ex. faktoranalys, strukturella ekvationer, icke-negativ matrisfaktorisering, mångfaldsanpassning, auto-associativa slumpmässiga skogar. (2) Övervakad modellering: Olika familjer av metoder för prediktion t.ex. modellbaserade, linjära, basexpansionsbaserade, lokala, additiva, trädbaserade, regelbaserade, neuronnätsbaserade, supportvektorbaserade, prototypbaserade. (3) Övergripande algoritmiska modelleringstekniker: Ensemblemetoder, Bagging, Boosting och Bayesiansk inferens, prestandautvärdering, modellval, variabelselektion.
Undervisning
Föreläsningar, seminarier, datorövningar och projekt.
Examination
Teori 5 hp, Implementering och projekt 10 hp. För godkänd kurs krävs deltagande i minst 80% av implementerings- och projektmöten samt en godkänd projektrapport. Teoridelen examineras genom ett skriftligt prov samt obligatoriska inlämningsuppgifter.