Kursplan för Komplexa data - analys och visualisering

Complex Data: Analysis and Visualisation

Kursplan

  • 15 högskolepoäng
  • Kurskod: 1MB525
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Teknik A1N, Bioinformatik A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå
    G1N: har endast gymnasiala förkunskapskrav
    G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    GXX: kursens fördjupning kan inte klassificeras.

    Avancerad nivå
    A1N: har endast kurs/er på grundnivå som förkunskapskrav
    A1F: har kurs/er på avancerad nivå som förkunskapskrav
    A1E: innehåller examensarbete för magisterexamen
    A2E: innehåller examensarbete för masterexamen
    AXX: kursens fördjupning kan inte klassificeras.

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2011-03-07
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Reviderad: 2018-08-30
  • Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: vecka 30, 2019
  • Behörighet: 120 hp inklusive Beräkningsvetenskap II alternativt genomgången årskurs ett inom masterprogrammen Molekylär bioteknik eller Bioinformatik.
  • Ansvarig institution: Institutionen för biologisk grundutbildning

Mål

Kursen syftar till att ge kunskap om analys och visualisering av komplexa multidimensionella data.
Efter godkänd kurs ska studenten kunna:

  • förklara de teoretiska grundprinciperna för några modellfamiljer inom ämnesområdet och tillämpa dessa på biomedicinska/biologiska data
  • förklara de teoretiska grundprinciperna för några övergripande algoritmiska modelleringstekniker inom ämnesområdet och tillämpa dessa på biomedicinska/biologiska data
  • självständigt välja lämpliga metoder för givna biologiska/biomedicinska data och frågeställningar
  • kritiskt analysera, värdera och sammanställa biologiska/biomedicinska resultat baserat de modeller som skapas från komplexa datamängder.

Innehåll

Kursen behandlar analys och visualisering av komplexa multidimensionella data där insamlade mätvärden för en observation kan bestå av en kombination av olika kvalitativa och kvantitativa variabler som oftast kommer med tillhörande mätosäkerheter (teknisk variation), ibland är helt okända (missing data), och ibland är censurerade (p.g.a. detektionströsklar och/eller mättnadseffekter i mätinstrument).
(1) Oövervakad explorativ modellering: Komprimering och visualisering i form av t.ex. faktoranalys, klustring, multidimensionell skalning,, icke-negativ matrisfaktorisering, mångfaldsanpassning, autoassociativa avbildningar. (2) Övervakad modellering: Olika familjer av metoder för prediktion t.ex. modellbaserade, linjära, basexpansionsbaserade, lokala, additiva, trädbaserade, regelbaserade, neuronnätsbaserade, supportvektorbaserade, prototypbaserade. (3) Övergripande algoritmiska modelleringstekniker som ensemblemetoder, bagging, boosting och Bayesiansk inferens, prestandautvärdering, modellval, variabelselektion.

Undervisning

Föreläsningar, seminarier, datorövningar och projekt.

Examination

Teori 5 hp, Implementering och projekt 10 hp. För godkänd kurs krävs deltagande i minst 80% av implementerings- och projektmöten samt en godkänd projektrapport. Teoridelen examineras genom ett skriftligt prov samt obligatoriska inlämningsuppgifter. 
 
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t ex vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Litteratur

Litteraturlista

Gäller från: vecka 30, 2019

  • Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome The elements of statistical learning : data mining, inference, and prediction

    2. ed.: New York: Springer, 2009

    Se bibliotekets söktjänst

    Obligatorisk