Data engineering I
Kursplan, Avancerad nivå, 1TD169
- Kod
- 1TD169
- Utbildningsnivå
- Avancerad nivå
- Huvudområde(n) med fördjupning
- Dataanalys A1N, Datavetenskap A1N, Teknik A1N, Tillämpad beräkningsvetenskap A1N
- Betygsskala
- Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
- Fastställd av
- Teknisk-naturvetenskapliga fakultetsnämnden, 18 oktober 2022
- Ansvarig institution
- Institutionen för informationsteknologi
Behörighetskrav
120 hp inom teknik/naturvetenskap inklusive 50 hp datavetenskap och matematik, varav minst 20 hp datavetenskap och minst 20 hp matematik. Inom datavetenskap ska ingå minst 10 hp programmering och genomgången Databasteknik I. Inom matematik ska linjär algebra och sannolikhet och statistik ingå. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
Mål
Efter godkänd kurs ska studenten kunna:
- använda publika och privata molnlösningar;
- diskutera nyckelbegrepp inom molnteknologi såsom Infrastructure as a Service (IaaS), Platform as a service (PaaS) och Software as a Service (SaaS);
- tillämpa grundläggande säkerhet i molnlösningar;
- använda moderna system för hantering av massiva datamängder inom vetenskapliga tillämpningar;
- analysera egenskaper hos dataintensiva vetenskapliga tillämpningar och använda analysen till att föreslå lämpliga strategier för att hantera tillämpningen;
- implementera programvara där analysen från föregående punkt och teknologi som presenteras i kursen används;
- kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.
Innehåll
Kursen är en tillämpningsorienterad introduktion till molnberäkningar och data engineering. Grundläggande begrepp inom molnteknologi, såsom virtualisering, servicelager och grundläggande säkerhet. Praktisk användning av molnlösningar. Olika lösningar för att hantera storskalig datalagring och deras fördelar och nackdelar, inklusive molnbaserad dynamisk allokering av volymer, objektlagring, distribuerade filsystem (såsom HDFS) och SQL och NoSQL databaser. Design och utveckling av batchanalyspipelines för stora dataset. Programmeringsmodellen MapReduce och applikationer av denna baserat på ramverk så som Apache Hadoop och Apache Spark. Utvärdering och analys av skalbarhet, inklusive begreppen horisontell och vertikal skalning, samt stark och svag skalning.
Undervisning
Föreläsningar, seminarier, gästföreläsningar och laborationer. Kursdeltagarna arbetar både i grupp och individuellt.
Examination
Skriftlig och muntlig redovisning av inlämningsuppgifter. Skriftlig redovisning av programvaruprojekt. Aktivt deltagande i seminarier.
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.