Utbildning

Kursplan för Data mining och data warehousing

Data Mining and Data Warehousing

Kursplan

  • 7,5 högskolepoäng
  • Kurskod: 2AD332
  • Utbildningsnivå: Grundnivå
  • Huvudområd(en) och successiv fördjupning: Data- och systemvetenskap G2F
  • Betygsskala: Underkänd (U), godkänd (G), väl godkänd (VG).
  • Inrättad: 2009-06-05
  • Inrättad av: Institutionsstyrelsen
  • Reviderad: 2016-10-25
  • Reviderad av: Institutionsstyrelsen
  • Gäller från: vecka 43, 2016
  • Behörighet: Data- och systemvetenskap 52,5 hp eller motsvarande, varav minst 7,5 hp databaser
  • Ansvarig institution: Institutionen för informatik och media

Mål

Vad gäller kunskap och förståelse förväntas studenten efter genomgången kurs kunna
- förklara väsentliga begrepp inom områdena datalagring (Data Warehousing), Big Data Analytics och datautvinning (Data Mining)
- förklara hur olika databassystem, med betoning på datalager och NoSQL-teknologier, kan förbättra beslutsprocesser i organisationer
- beskriva olika datautvinningsmetoder samt skillnaderna mellan dessa
- förklara i vilka situationer en viss datautvinningsmetod kan användas för att besvara en given fråga
 
Vad gäller färdigheter och förmåga förväntas studenten efter genomgången kurs kunna
- planera en forskningsfrågebaserad datautvinningsprocess, inklusive val av data, förbehandlingsmetod(er), datautvinningsmetod(er) samt metod för evaluering av resultaten
- använda elementära datautvinningsmetoder för att genomföra analyser
 
Vad gäller värderingsförmåga och förhållningssätt förväntas studenten efter genomgången kurs kunna
- tolka och analysera resultaten av en datautvinningsprocess, samt värdera effekterna av val som har gjorts under processen
- analysera och värdera de sociala följderna av datautvinning och Big Data i samhället med hänsyn till etiska aspekter
 

Innehåll

Datatyper och dataegenskaper, datatransformation
Dataanalys och datalagring
Datalagringssystem och komponenter
Teknologier för behandling av Big Data samt tillämpningar
Datautvinningsprocessen
Datautvinningsmetoder: klassificering, klustring, associationsanalys, avvikelseanalys samt textutvinning
Datautvinningstillämpningar
Samhälleliga och etiska följder av datautvinning och Big Data Analytics
 

Undervisning

Föreläsningar, laborationer, seminarier
 

Examination

Tentamen, inlämningsuppgifter, laborationer, seminarium
 

Litteratur

Gäller från: vecka 44, 2016

  • Tan, Pang-Ning; Steinbach, Michael; Kumar, Vipin Introduction to data mining

    Boston: Pearson Addison Wesley, 2006

    Se bibliotekets söktjänst