Kursplan för Stora datamängder inom vetenskapliga tillämpningar

Large Datasets for Scientific Applications

Kursplan

  • 5 högskolepoäng
  • Kurskod: 1TD267
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Datavetenskap A1F, Teknik A1F, Tillämpad beräkningsvetenskap A1F

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå

    • G1N: har endast gymnasiala förkunskapskrav
    • G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    • G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    • G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    • G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    • GXX: kursens fördjupning kan inte klassificeras

    Avancerad nivå

    • A1N: har endast kurs/er på grundnivå som förkunskapskrav
    • A1F: har kurs/er på avancerad nivå som förkunskapskrav
    • A1E: innehåller examensarbete för magisterexamen
    • A2E: innehåller examensarbete för masterexamen
    • AXX: kursens fördjupning kan inte klassificeras

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2014-03-13
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: HT 2014
  • Behörighet:

    120 hp inkl. Programmeringsteknik II eller motsvarande (programmering i Java och/eller Python). Databasteknik II och Beräkningsvetenskap I alternativt Beräkningsvetenskap DV eller motsvarande.  

  • Ansvarig institution: Institutionen för informationsteknologi
  • Kursen är avvecklad.

Mål

Efter godkänd kurs ska studenten kunna

  • använda moderna system för hantering av massiva datamängder inom vetenskapliga tillämpningar;
  • analysera egenskaper hos dataintensiva vetenskapliga tillämpningar och använda analysen till att föreslå lämpliga strategier för att hantera tillämpningen;
  • implementera programvara där analysen från föregående punkt och teknologi som presenteras i kursen används;
  • kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.

Innehåll

Metodik vid utveckling av vetenskapliga tillämpningar där man använder begrepp och metoder inom storskalig datahantering. Distribuerade filsystem och molnbaserade lagringsmiljöer, t.ex. OpenStack Swift. Processning av Batch data med programmeringsmodellen MapReduce, t.ex. Hadoop. Effektiv användning av frågespråk som Hive för vetenskapliga tillämpningar. Effektiv användning av indexering. Array-databaser, t.ex. SciDB, plattformar för strömmande data, t.ex. Storm. Översiktlig beskrivning av tekniker, begrepp och verktyg för analys av stora datamängder, t.ex. NoSQL, NoDB, ostrukturerad namnrymd och ontologibaserad data.

Undervisning

Föreläsningar, gästföreläsningar, laborationer och grupphandledning. Inlämningsuppgifter med muntlig och skriftlig presentation.

Examination

Inlämningsuppgifter och programvaruprojekt. Aktivt deltagande i seminarier. Muntlig och skriftlig diskussion av inlämningsuppgifter och forskningsartiklar.

Litteratur

Litteraturlista

Gäller från: HT 2014

I bibliotekets söktjänst kan du se om en titel finns elektroniskt.

Forskningsartiklar.