Kursplan för Informationsutvinning I
Data Mining I
Kursplan
- 5 högskolepoäng
- Kurskod: 1DL360
- Utbildningsnivå: Avancerad nivå
-
Huvudområde(n) och successiv fördjupning:
Datavetenskap A1N,
Teknik A1N
Förklaring av koder
Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:
Grundnivå
- G1N: har endast gymnasiala förkunskapskrav
- G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
- G1E: innehåller särskilt utformat examensarbete för högskoleexamen
- G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
- G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
- GXX: kursens fördjupning kan inte klassificeras
Avancerad nivå
- A1N: har endast kurs/er på grundnivå som förkunskapskrav
- A1F: har kurs/er på avancerad nivå som förkunskapskrav
- A1E: innehåller examensarbete för magisterexamen
- A2E: innehåller examensarbete för masterexamen
- AXX: kursens fördjupning kan inte klassificeras
- Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
- Inrättad: 2010-03-18
- Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
- Reviderad: 2022-02-01
- Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
- Gäller från: HT 2022
-
Behörighet:
120 hp med 25 hp matematik, inklusive matematisk statistik, och 45 hp datavetenskap och/eller teknik, inklusive Databasteknik I och en fortsättningskurs i programmering. Algoritmer och datastrukturer I rekommenderas. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
- Ansvarig institution: Institutionen för informationsteknologi
Mål
Efter godkänd kurs ska studenten kunna:
- förklara olika metoder att utvinna förädlad information ur stora datamängder, både i teori och i praktisk tillämpning
- använda dessa metoder med lämpliga verktyg
- utvärdera och jämföra olika metoders lämplighet
- göra bedömningar med hänsyn till relevanta vetenskapliga, samhälleliga och etiska aspekter i tillämpning av informationsutvinning
- lösa informationsutvinningsproblem i grupp.
Innehåll
Introduktion till informationsutvinning och dess terminologi, översikt över olika typer av data (t.ex. tabeller, text, grafer) och dess egenskaper, en översikt över olika metoder för att utforska stora datamängder, datapreparering (t.ex. normalisering, PCA), introduktion till klassificeringsmetoder (t.ex. k-NN, C4.5), introduktion till klustringsmetoder (t.ex. k-means, single-link, DB-Scan, grafklustringsalgoritmer), introduktion till associationsanalys (t.ex. Apriori), samhälleliga och etiska aspekter inom området informationsutvinning, validering.
Ämnena behandlas både teoretiskt och praktiskt genom laborationer där utvalda metoder implementeras och testas på typiska datamängder.
Undervisning
Föreläsningar, seminarier, laborationer och projekt. Gästföreläsning.
Examination
Skriftlig tentamen och ett projekt som redovisas muntligt och skriftligt.
Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.
Litteratur
Litteraturlista
Gäller från: HT 2022
I bibliotekets söktjänst kan du se om en titel finns elektroniskt.
-
Introduction to data mining
Tan, Pang-Ning;
Steinbach, Michael;
Karpatne, Anuj;
Kumar, Vipin
Second edition.: Harlow: Pearson Education, 2020
Obligatorisk
-
Leskovec, Jurij;
Rajaraman, Anand;
Ullman, Jeffrey D.
Mining of massive datasets
Third edition.: Cambridge, United Kingdom: Cambridge University Press, 2020