Informationssystem C: Data mining och tillämpad maskininlärning
Kursplan, Grundnivå, 2IS081
- Kod
- 2IS081
- Utbildningsnivå
- Grundnivå
- Huvudområde(n) med fördjupning
- Informationssystem G2F
- Betygsskala
- Underkänd (U), godkänd (G), väl godkänd (VG)
- Fastställd av
- Institutionsstyrelsen, 9 december 2021
- Ansvarig institution
- Institutionen för informatik och media
Allmänt
Kursen tillhör biområdet databasteknik.
Behörighetskrav
60 hp informationssystem eller motsvarande inklusive 7,5 hp databaser
Mål
Vad gäller kunskap och förståelse förväntas studenten efter genomgången kurs kunna
- förklara begrepp inom områdena datautvinning (data mining) och maskininlärning,
- förklara hur maskininlärning kan stödja arbetet med att besvara en forskningsfråga i ett data mining-projekt,
- beskriva metoder för övervakad och oövervakad maskininlärning och hur de tillämpas, samt hur de kan stödja beslutsfattande i organisationer,
- förklara i vilka situationer en viss datautvinningsmetod kan användas för att besvara en given fråga,
- förklara vilket förhållande datautvinning och maskininlärning har till närliggande fält som analytics, data science och beslutsteori.
Vad gäller färdigheter och förmåga förväntas studenten efter genomgången kurs kunna
- planera en datautvinningsprocess baserad på användning av maskininlärningsmetoder, inklusive identifiering av problem, formulering av frågor, val av data, förbehandlingsmetod(er), maskininlärningsmetod(er) samt metod för evaluering av resultaten,
- använda maskininlärningsmetoder för att genomföra analyser.
Vad gäller värderingsförmåga och förhållningssätt förväntas studenten efter genomgången kurs kunna
- tolka och analysera resultaten av en datautvinningsprocess, samt värdera effekterna av val som har gjorts under processen,
- reflektera kring de sociala följderna av datautvinning och maskininlärning i samhället med hänsyn till etiska aspekter.
Innehåll
Kursen introducerar studenten till maskininlärning som en klass av metoder för att besvara en forskningsfråga inom ramen för datautvinning. I kursen behandlas datautvinning som ett vetenskapligt inriktat tillvägagångssätt som inbegriper problemidentifiering, frågeformulering, identifiering och förbehandling av data, val och tillämpning av analysmetod, samt analys och evaluering av resultaten. Under kursen diskuteras data ingående, bland annat olika datatyper och dataegenskaper, datatransformation, samt hur man kan behandla semi- eller ostrukturerade data, vilket ofta karaktäriserar big data. Vidare presenteras och tillämpas datautvinningsprocessen och maskininlärningsuppgifter som regression, klassificering, klustring, associationsanalys, avvikelseanalys och textutvinning. Dessutom diskuteras tillämpningsområden samt metodernas styrkor och svagheter. Till slut diskuteras också samhälleliga och etiska följder av datautvinning och maskininlärning.
Undervisning
Föreläsningar, laborationer, seminarier.
Examination
Tentamen, inlämningsuppgifter, laborationer, seminarium.
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare eller beslut om undantag som fattats av institutionens arbetsgrupp för studieärenden.