Data engineering I

7,5 hp

Kursplan, Avancerad nivå, 1TD069

Det finns en senare version av kursplanen.
Kod
1TD069
Utbildningsnivå
Avancerad nivå
Huvudområde(n) med fördjupning
Dataanalys A1N, Datavetenskap A1N, Teknik A1N, Tillämpad beräkningsvetenskap A1N
Betygsskala
Med beröm godkänd, icke utan beröm godkänd, godkänd, underkänd
Fastställd av
Teknisk-naturvetenskapliga fakultetsnämnden, 25 februari 2020
Ansvarig institution
Institutionen för informationsteknologi

Behörighetskrav

120 hp inom teknik/naturvetenskap inklusive 80 hp datavetenskap och matematik, varav minst 20 hp datavetenskap och minst 30 hp matematik. Inom datavetenskap ska minst 10 hp programmering, 5 hp beräkningsvetenskap samt Databasteknik I ingå. Inom matematik ska ingå linjär algebra och sannolikhet och statistik. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)

Mål

Efter godkänd kurs ska studenten kunna

  • använda publika och privata molnlösningar;
  • diskutera nyckelbegrepp inom molnteknologi såsom Infrastructure as a Service (IaaS), Platform as a service (PaaS) och Software as a Service (SaaS);
  • tillämpa grundläggande säkerhet i molnlösningar;
  • använda moderna system för hantering av massiva datamängder inom vetenskapliga tillämpningar;
  • analysera egenskaper hos dataintensiva vetenskapliga tillämpningar och använda analysen till att föreslå lämpliga strategier för att hantera dem;
  • implementera programvara där analysen från föregående punkt och teknik som presenteras i kursen används;
  • använda containerteknologi för automatiserad driftsättning och kontinuerlig integrering;
  • kritiskt analysera, diskutera och presentera lösningar och implementationer skriftligt och muntligt.

Innehåll

Kursen är en tillämpningsorienterad introduktion till molnberäkningar och data engineering. Grundläggande begrepp inom molnteknologi, såsom virtualisering, servicelager och grundläggande säkerhet. Praktisk användning av molnlösningar. Olika lösningar för att hantera storskalig datalagring och deras fördelar och nackdelar, inklusive molnbaserad dynamisk allokering av volymer, objektlagring, distribuerade filsystem (såsom HDFS) och SQL och NoSQL databaser. Design och utveckling av batchanalyspipelines för stora dataset. Programmeringsmodellen MapReduce och applikationer av denna baserat på ramverk så som Apache Hadoop och Apache Spark. Utvärdering och analys av skalbarhet, inklusive begreppen horisontell och vertikal skalning, och stark och svag skalning. Användande av containerteknologi och en introduktion till kontinuerlig integrering och deployment.

Undervisning

Föreläsningar och seminarier, gästföreläsningar och laborationer. Kursdeltagarna arbetar både i grupp och individuellt.

Examination

Skriftlig och muntlig redovisning av inlämningsuppgifter. Skriftlig redovisning av programvaruprojekt. Aktivt deltagande i seminarier.

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

FÖLJ UPPSALA UNIVERSITET PÅ

facebook
instagram
twitter
youtube
linkedin