Introduktion till dataanalys

10 hp

Kursplan, Avancerad nivå, 1MS041

Det finns en senare version av kursplanen.
Kod
1MS041
Utbildningsnivå
Avancerad nivå
Huvudområde(n) med fördjupning
Dataanalys A1N, Datavetenskap A1N, Matematik A1N
Betygsskala
Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
Fastställd av
Teknisk-naturvetenskapliga fakultetsnämnden, 22 oktober 2021
Ansvarig institution
Matematiska institutionen

Behörighetskrav

120 hp inklusive 80 hp datavetenskap och matematik, varav minst 15 hp datavetenskap inklusive programmering, och minst 30 hp matematik inklusive sannolikhet och statistik, linjär algebra och envariabelanalys. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)

Mål

Efter godkänd kurs ska studenten kunna

  • hitta offentligt tillgängliga datamängder och utvärdera deras användbarhet för givna ändamål;
  • behandla data och transformera den för analys;
  • använda vanliga metoder för klustring och dimensionsreduktion för att utforska datamängder och argumentera på matematiska grunder för metodernas relevans för datamängden och ändamålet i fråga;
  • välja bland vanligt förekommande probabilistiska modeller för analys av datamängder;
  • vid val av modell ta hänsyn till begränsningar i beräkningskapacitet;
  • utvärdera pålitligheten av en lösning genom att tillämpa lämpliga teoretiska principer;
  • genomgående ta hänsyn till aspekter inom etik, juridik och integritet;
  • presentera slutsatserna av en analys/slutprodukten skriftligt på ett tillgängligt sätt.

Innehåll

Vanliga sannolikhetsteoretiska modeller och relaterade inferensprinciper, såsom regression/klassifikation, hypotesprövning, matrisifyllning; typiska tillämpningar inom data science, såsom prediktion, rekommendation, A/B-test, samt vanliga algoritmer för deras implementation; modellering av beroende i underliggande sannolikhetsfördelningar som uppstår från temporal-, spatial- och nätverksstruktur; elementär data-behandling (ELT/Extract-Load-Transform): transformation/rengöring av data för senare behandling genom att kombinera data från olika källor och genom att använda dimensionsreduktions- och klustringsmetoder; användning av visualisering för undersökande dataanalys (Exploratory Data Analysis) och för att kommunicera resultat; juridiska och etiska aspekter gällande inhämtning, behandlig och förvaring av data, fallstudier med hjälp av verklig data som involverar relevant databehandling, modellering och inferens.

Undervisning

Föreläsningar och laborationer.

Examination

Skriftligt prov (7,5 hp) samt skriftlig redovisning av laborationer och inlämningsuppgifter (2,5 hp).

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

FÖLJ UPPSALA UNIVERSITET PÅ

facebook
instagram
twitter
youtube
linkedin