Kursplan för Informationsutvinning I

Data Mining I

Kursplan

  • 5 högskolepoäng
  • Kurskod: 1DL360
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Datavetenskap A1N, Teknik A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå
    G1N: har endast gymnasiala förkunskapskrav
    G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    GXX: kursens fördjupning kan inte klassificeras.

    Avancerad nivå
    A1N: har endast kurs/er på grundnivå som förkunskapskrav
    A1F: har kurs/er på avancerad nivå som förkunskapskrav
    A1E: innehåller examensarbete för magisterexamen
    A2E: innehåller examensarbete för masterexamen
    AXX: kursens fördjupning kan inte klassificeras.

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2010-03-18
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Reviderad: 2020-02-12
  • Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: vecka 27, 2020
  • Behörighet: 120 hp med 25 hp matematik, inklusive matematisk statistik, och 45 hp datavetenskap och/eller teknik, inklusive Databasteknik I och en fortsättningskurs i programmering. Algoritmer och datastrukturer I rekommenderas.
    Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
  • Ansvarig institution: Institutionen för informationsteknologi

Mål

Efter godkänd kurs ska studenten kunna:

  • förklara olika metoder att utvinna förädlad information ur stora datamängder, både i teori och i praktisk tillämpning
  • använda dessa metoder med lämpliga verktyg
  • utvärdera och jämföra olika metoders lämplighet
  • göra bedömningar med hänsyn till relevanta vetenskapliga, samhälleliga och etiska aspekter i tillämpning av informationsutvinning
  • lösa informationsutvinningsproblem i grupp.

Innehåll

Introduktion till informationsutvinning och dess terminologi, översikt över olika typer av data (t.ex. tabeller, text, grafer) och dess egenskaper, en översikt över olika metoder för att utforska stora datamängder, datapreparering (t.ex. normalisering, PCA), introduktion till klassificeringsmetoder (t.ex. k-NN, C4.5), introduktion till klustringsmetoder (t.ex. k-means, single-link, DB-Scan, grafklustringsalgoritmer), introduktion till associationsanalys (t.ex. a priori), hantering av personlig integritet inom området informationsutvinning, validering.

Ämnena behandlas både teoretiskt och praktiskt genom laborationer där utvalda metoder implementeras och testas på typiska datamängder.

Undervisning

Föreläsningar, seminarier, laborationer och projekt. Gästföreläsning.

Examination

Skriftlig tentamen och ett projekt som redovisas muntligt och skriftligt. 

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Litteratur

Litteraturlista

Gäller från: vecka 27, 2020

  • Introduction to data mining Tan, Pang-Ning; Steinbach, Michael; Karpatne, Anuj; Kumar, Vipin

    Second edition.: Harlow: Pearson Education, 2020

    Se bibliotekets söktjänst

    Obligatorisk

  • Leskovec, Jurij; Rajaraman, Anand; Ullman, Jeffrey D. Mining of massive datasets

    Third edition.: Cambridge, United Kingdom: Cambridge University Press, 2020

    Se bibliotekets söktjänst