Kursplan för Stora datamängder inom vetenskapliga tillämpningar

Large Datasets for Scientific Applications

Kursplan

  • 5 högskolepoäng
  • Kurskod: 1TD267
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Datavetenskap A1F, Teknik A1F, Tillämpad beräkningsvetenskap A1F

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå
    G1N: har endast gymnasiala förkunskapskrav
    G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    GXX: kursens fördjupning kan inte klassificeras.

    Avancerad nivå
    A1N: har endast kurs/er på grundnivå som förkunskapskrav
    A1F: har kurs/er på avancerad nivå som förkunskapskrav
    A1E: innehåller examensarbete för magisterexamen
    A2E: innehåller examensarbete för masterexamen
    AXX: kursens fördjupning kan inte klassificeras.

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2014-03-13
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: vecka 30, 2014
  • Behörighet: 120 hp inkl. Programmeringsteknik II eller motsvarande (programmering i Java och/eller Python). Databasteknik II och Beräkningsvetenskap I alternativt Beräkningsvetenskap DV eller motsvarande.  
  • Ansvarig institution: Institutionen för informationsteknologi

Mål

Efter godkänd kurs ska studenten kunna

  • använda moderna system för hantering av massiva datamängder inom vetenskapliga tillämpningar;
  • analysera egenskaper hos dataintensiva vetenskapliga tillämpningar och använda analysen till att föreslå lämpliga strategier för att hantera tillämpningen;
  • implementera programvara där analysen från föregående punkt och teknologi som presenteras i kursen används;
  • kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.

Innehåll

Metodik vid utveckling av vetenskapliga tillämpningar där man använder begrepp och metoder inom storskalig datahantering. Distribuerade filsystem och molnbaserade lagringsmiljöer, t.ex. OpenStack Swift. Processning av Batch data med programmeringsmodellen MapReduce, t.ex. Hadoop. Effektiv användning av frågespråk som Hive för vetenskapliga tillämpningar. Effektiv användning av indexering. Array-databaser, t.ex. SciDB, plattformar för strömmande data, t.ex. Storm. Översiktlig beskrivning av tekniker, begrepp och verktyg för analys av stora datamängder, t.ex. NoSQL, NoDB, ostrukturerad namnrymd och ontologibaserad data.

Undervisning

Föreläsningar, gästföreläsningar, laborationer och grupphandledning. Inlämningsuppgifter med muntlig och skriftlig presentation.

Examination

Inlämningsuppgifter och programvaruprojekt. Aktivt deltagande i seminarier. Muntlig och skriftlig diskussion av inlämningsuppgifter och forskningsartiklar.

Litteratur

Litteraturlista

Gäller från: vecka 30, 2014

Forskningsartiklar.