Kursplan för Data engineering II
Data Engineering II
Kursplan
- 7,5 högskolepoäng
- Kurskod: 1TD075
- Utbildningsnivå: Avancerad nivå
-
Huvudområde(n) och successiv fördjupning:
Datavetenskap A1F,
Dataanalys A1F,
Tillämpad beräkningsvetenskap A1F
Förklaring av koder
Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:
Grundnivå
- G1N: har endast gymnasiala förkunskapskrav
- G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
- G1E: innehåller särskilt utformat examensarbete för högskoleexamen
- G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
- G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
- GXX: kursens fördjupning kan inte klassificeras
Avancerad nivå
- A1N: har endast kurs/er på grundnivå som förkunskapskrav
- A1F: har kurs/er på avancerad nivå som förkunskapskrav
- A1E: innehåller examensarbete för magisterexamen
- A2E: innehåller examensarbete för masterexamen
- AXX: kursens fördjupning kan inte klassificeras
- Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
- Inrättad: 2020-02-27
- Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
- Reviderad: 2022-10-23
- Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
- Gäller från: HT 2023
-
Behörighet:
120 hp inklusive genomgången Data engineering I. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
- Ansvarig institution: Institutionen för informationsteknologi
Mål
Efter godkänd kurs ska studenten kunna
- beskriva styrkor och svagheter hos, samt praktiskt använda moderna system för hantering av strömmande data;
- analysera egenskaper hos dataintensiva tillämpningar med strömmande data och använda analysen till att föreslå lämpliga arkitekturer för att hantera tillämpningen inklusive kombination av strömmande data och batchanalys;
- implementera programvara där analysen från föregående punkt och teknik som presenteras i kursen används;
- redogöra för och hantera praktiska aspekter av produktionssättning av maskininlärningsmodeller;
- använda sig av ramverk för storskalig distribuerad maskininlärning;
- kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.
Innehåll
Syftet med den här kursen är att ge de avancerade kunskaper i skalbar analys av strömmande data, förståelse för det processer och teknologier som krävs för storskalig distribuerad maskininlärning, samt färdighet i att bygga upp och automatisera pipelines och workflows som täcker hela kedjan från data till maskininlärningsmodeller i produktion. Avancerade koncept i molnberäkningar såsom orkestrering av programbehållare (containers) och automatisering. Teori och ramverk för skalbar hantering och analys av dataströmmar såsom Apache Spark och Apache Kafka. Driftsättning och användande av ramverk för distribuerad maskininlärning. Mjukvara och system för konstruktion av molnnativa workflows för kontinuerlig modellering, övervakning och produktionssättning av modeller. Livscykelhantering av maskininlärningsmodeller.
Undervisning
Föreläsningar, gästföreläsningar, laborationer, seminarier och grupphandledning.
Examination
Aktivt deltagande i seminarier. Muntlig och skriftlig redovisning av inlämningsuppgifter, ett programvaruprojekt och forskningsartiklar.
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.
Versioner av kursplanen
Litteratur
Litteraturlista
Gäller från: HT 2023
I bibliotekets söktjänst kan du se om en titel finns elektroniskt.
Aktuella forskningsartiklar, rapporter och tutorials.