Informationssystem C: Data mining och data science
Kursplan, Grundnivå, 2IS063
Kursen är avvecklad.
- Kod
- 2IS063
- Utbildningsnivå
- Grundnivå
- Huvudområde(n) med fördjupning
- Informationssystem G2F
- Betygsskala
- Väl godkänd (VG), Godkänd (G), Underkänd (U)
- Fastställd av
- Institutionsstyrelsen, 26 oktober 2017
- Ansvarig institution
- Institutionen för informatik och media
Allmänt
Kursen tillhör biområdet databasteknik.
Behörighetskrav
60 hp informationssystem eller motsvarande inklusive 7,5 hp databaser
Mål
Vad gäller kunskap och förståelse förväntas studenten efter genomgången kurs kunna
- förklara väsentliga begrepp inom områdena datalagring (data warehousing), big data analytics, datautvinning (data mining) och data science
- förklara hur datautvinning kan stödja arbetet med att besvara en forskningsfråga i ett data science projekt
- förklara hur olika databassystem, med betoning på datalager och NoSQL-teknologier, kan förbättra beslutsprocesser i organisationer
- beskriva olika datautvinningsmetoder samt skillnaderna mellan dessa
- förklara i vilka situationer en viss datautvinningsmetod kan användas för att besvara en given fråga
Vad gäller färdigheter och förmåga förväntas studenten efter genomgången kurs kunna
- planera en forskningsfrågebaserad data science process baserad på datautvinning, inklusive identifiering av problem, formulering av frågor, val av data, förbehandlingsmetod(er), datautvinningsmetod(er) samt metod för evaluering av resultaten
- använda elementära datautvinningsmetoder för att genomföra analyser
Vad gäller värderingsförmåga och förhållningssätt förväntas studenten efter genomgången kurs kunna
- tolka och analysera resultaten av en datautvinningsprocess, samt värdera effekterna av val som har gjorts under processen
- analysera och värdera de sociala följderna av datautvinning och big data i samhället med hänsyn till etiska aspekter
Innehåll
Kursen introducerar studenten till datautvinning som metod för att besvara en forskningsfråga i en övergripande data science process. Data science processen är en vetenskapligt inriktad process som inbegriper problemidentifiering, frågeformulering, identifiering och förbehandling av data, val och tillämpning av analysmetod, samt analys och evaluering av resultaten. Under kursen diskuteras data ingående, bland annat olika datatyper och dataegenskaper, datatransformation, datalagringssystem och modeller, samt hur man kan behandla semi- eller ostrukturerade data, vilket ofta karaktäriserar big data. Vidare presenteras och tillämpas datautvinningsprocessen och de huvusakliga datautvinningsmetoderna som klassificering, klustring, associationsanalys, avvikelseanalys och textutvinning. Dessutom diskuteras tillämpningsområden samt metodernas styrkor och svagheter. Till slut diskuteras också samhälleliga och etiska följder av datautvinning och big data analytics.
Undervisning
Föreläsningar, laborationer, seminarier.
Examination
Tentamen, inlämningsuppgifter, laborationer, seminarium.