Kursplan för Big data i biovetenskap

Big Data in Life Sciences

  • 5 högskolepoäng
  • Kurskod: 1TD065
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Datavetenskap A1N, Bioinformatik A1N, Teknik A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå

    • G1N: har endast gymnasiala förkunskapskrav
    • G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    • G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    • G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    • G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    • GXX: kursens fördjupning kan inte klassificeras

    Avancerad nivå

    • A1N: har endast kurs/er på grundnivå som förkunskapskrav
    • A1F: har kurs/er på avancerad nivå som förkunskapskrav
    • A1E: innehåller examensarbete för magisterexamen
    • A2E: innehåller examensarbete för masterexamen
    • AXX: kursens fördjupning kan inte klassificeras

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2020-02-25
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Reviderad: 2020-02-25
  • Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: VT 2021
  • Behörighet:

    120 hp inklusive (1) 15 hp datavetenskap, varav 5 hp programmering, och 15 biologi; eller (2) 15 hp inom Masterprogram i bioinformatik, varav 5 hp programmering. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)

  • Ansvarig institution: Institutionen för informationsteknologi

Mål

Efter godkänd kurs ska studenten kunna

  • förklara teorier och metoder relevanta för hantering och analys av stora datamängder inom biovetenskapliga tillämpningar;
  • använda moderna system för hantering och analys av stora datamängder inom biovetenskapliga tillämpningar;
  • analysera egenskaper hos dataintensiva biovetenskapliga tillämpningar och använda analysen till att föreslå lämpliga strategier för att hantera tillämpningen;
  • kritiskt analysera, diskutera och presentera lösningar skriftligt och muntligt.

Innehåll

Metodik vid biovetenskapliga tillämpningar där begrepp och metoder inom storskalig datahantering används. Hantering av biovetenskapliga data med programmeringsmodellen MapReduce, exempelvis Apache Spark. Batchsystem på beräkningskluster. Reproducerbar dataanalys med hjälp av workflowsystem. Analys med mjukvarucontainers och mikrotjänstbaserade ramverk, t ex Kubernetes. Användning av storskaliga lagringssystem och virtualiserade miljöer. Biovetenskapliga problemställningar med storskaliga data inom exempelvis genomik, proteomik, metabolomik, cellbiologi, läkemedelsutveckling och AI/maskininlärning.

Undervisning

Föreläsningar, gästföreläsningar, laborationer, seminarier och grupphandledning. Laborationer och seminarier är obligatoriska.

Examination

Skriftlig tentamen. Muntlig och skriftlig redovisning av inlämningsuppgifter. Aktivt deltagande i seminarier och laborationer.

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Litteratur

Uppgift om kurslitteratur saknas. Ta kontakt med ansvarig institution för mer information.