Stora datamängder inom vetenskapliga tillämpningar
Kursplan, Avancerad nivå, 1TD268
Kursen är avvecklad.
- Kod
- 1TD268
- Utbildningsnivå
- Avancerad nivå
- Huvudområde(n) med fördjupning
- Datavetenskap A1N, Teknik A1N, Tillämpad beräkningsvetenskap A1N
- Betygsskala
- Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
- Fastställd av
- Teknisk-naturvetenskapliga fakultetsnämnden, 26 oktober 2018
- Ansvarig institution
- Institutionen för informationsteknologi
Behörighetskrav
Alt 1. 120 hp inom teknik/naturvetenskap inklusive Beräkningsvetenskap I, Databasteknik I samt en fortsättningskurs i programmering (programmering i Java och/eller Python). Beräkningsvetenskap I får bytas ut mot Beräkningsvetenskap och analys, 10 hp, Numeriska metoder och simulering, 5 hp, Beräkningsvetenskap, bryggningskurs, 5 hp.
Alt 2. 120 hp inklusive Introduktion till programmering, beräkningsvetenskap och statistik, Databasteknik I och Programmering i Python.
Alt 3. 120 hp inklusive 30 hp matematik samt 30 hp datavetenskap varav minst 5 hp databaskunskap. Skriptprogrammering. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
Mål
Efter godkänd kurs ska studenten kunna
- använda moderna system för hantering av massiva datamängder inom vetenskapliga tillämpningar;
- analysera egenskaper hos dataintensiva vetenskapliga tillämpningar och använda analysen till att föreslå lämpliga strategier för att hantera tillämpningen;
- implementera programvara där analysen från föregående punkt och teknologi som presenteras i kursen används;
- kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.
Innehåll
Metodik vid utveckling av vetenskapliga tillämpningar där begrepp och metoder inom storskalig datahantering används. Distribuerade filsystem och molnbaserade lagringsmiljöer, exempelvis OpenStack Swift. Processning av Batch data med programmeringsmodellen MapReduce, exempelvis Hadoop. Effektiv användning av frågespråk som Hive för vetenskapliga tillämpningar. Effektiv användning av indexering. Array-databaser, exempelvis SciDB, plattformar för strömmande data, exempelvis Storm. Översiktlig beskrivning av tekniker, begrepp och verktyg för analys av stora datamängder, exempelvis NoSQL, NoDB, ostrukturerad namnrymd och ontologibaserad data.
Undervisning
Föreläsningar, gästföreläsningar, laborationer, seminarier och grupphandledning.
Examination
Aktivt deltagande i seminarier. Muntlig och skriftlig redovisning av inlämningsuppgifter, programvaruprojekt och forskningsartiklar.
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.