Data engineering I
Kursplan, Avancerad nivå, 1TD069
- Kod
- 1TD069
- Utbildningsnivå
- Avancerad nivå
- Huvudområde(n) med fördjupning
- Dataanalys A1N, Datavetenskap A1N, Teknik A1N, Tillämpad beräkningsvetenskap A1N
- Betygsskala
- Med beröm godkänd (5), Icke utan beröm godkänd (4), Godkänd (3), Underkänd (U)
- Fastställd av
- Teknisk-naturvetenskapliga fakultetsnämnden, 17 oktober 2022
- Ansvarig institution
- Institutionen för informationsteknologi
Behörighetskrav
120 hp inom teknik/naturvetenskap inklusive 80 hp datavetenskap och matematik, varav minst 20 hp datavetenskap och minst 30 hp matematik. Inom datavetenskap ska minst 10 hp programmering och Databasteknik I ingå. Inom matematik ska ingå linjär algebra och sannolikhet och statistik. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
Mål
Efter godkänd kurs ska studenten kunna
- använda publika och privata molnlösningar;
- diskutera nyckelbegrepp inom molnteknologi såsom Infrastructure as a Service (IaaS), Platform as a service (PaaS) och Software as a Service (SaaS);
- tillämpa grundläggande säkerhet i molnlösningar;
- använda moderna system för hantering av massiva datamängder inom vetenskapliga tillämpningar;
- analysera egenskaper hos dataintensiva vetenskapliga tillämpningar och använda analysen till att föreslå lämpliga strategier för att hantera dem;
- implementera programvara där analysen från föregående punkt och teknik som presenteras i kursen används;
- använda containerteknologi för automatiserad driftsättning och kontinuerlig integrering;
- kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.
Innehåll
Kursen är en tillämpningsorienterad introduktion till molnberäkningar och data engineering. Grundläggande begrepp inom molnteknologi, såsom virtualisering, servicelager och grundläggande säkerhet. Praktisk användning av molnlösningar. Olika lösningar för att hantera storskalig datalagring och deras fördelar och nackdelar, inklusive molnbaserad dynamisk allokering av volymer, objektlagring, distribuerade filsystem (såsom HDFS) och SQL och NoSQL databaser. Design och utveckling av batchanalyspipelines för stora dataset. Programmeringsmodellen MapReduce och applikationer av denna baserat på ramverk så som Apache Hadoop och Apache Spark. Utvärdering och analys av skalbarhet, inklusive begreppen horisontell och vertikal skalning, och stark och svag skalning. Användande av containerteknologi och en introduktion till kontinuerlig integrering och deployment.
Undervisning
Föreläsningar och seminarier, gästföreläsningar och laborationer. Kursdeltagarna arbetar både i grupp och individuellt.
Examination
Skriftlig och muntlig redovisning av inlämningsuppgifter. Skriftlig redovisning av programvaruprojekt. Aktivt deltagande i seminarier.
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.