Kursplan för Datorintensiv statistik och informationsutvinning
Computer-Intensive Statistics and Data Mining
Det finns en senare version av kursplanen.
Kursplan
- 10 högskolepoäng
- Kurskod: 1MS009
- Utbildningsnivå: Avancerad nivå
-
Huvudområde(n) och successiv fördjupning:
Matematik A1N
Förklaring av koder
Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:
Grundnivå
- G1N: har endast gymnasiala förkunskapskrav
- G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
- G1E: innehåller särskilt utformat examensarbete för högskoleexamen
- G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
- G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
- GXX: kursens fördjupning kan inte klassificeras
Avancerad nivå
- A1N: har endast kurs/er på grundnivå som förkunskapskrav
- A1F: har kurs/er på avancerad nivå som förkunskapskrav
- A1E: innehåller examensarbete för magisterexamen
- A2E: innehåller examensarbete för masterexamen
- AXX: kursens fördjupning kan inte klassificeras
- Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
- Inrättad: 2007-03-15
- Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
- Reviderad: 2016-04-22
- Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
- Gäller från: HT 2016
-
Behörighet:
120 hp med Regressionsanalys eller motsvarande.
- Ansvarig institution: Matematiska institutionen
Mål
För godkänt betyg på kursen skall studenten kunna
- redogöra för den teoretiska grunden för Markov Chain Monte Carlo-metoder och använda sådana tekniker för valda statistiska problem;
- redogöra för principerna för slumptalsgeneratorer;
- använda simuleringsmetoder som Bootstrap och SIMEX;
- använda EM-metoder;
- självständigt använda icke-parametriska statistiska modeller;
- använda statistisk programvara, företrädesvis R.
Innehåll
Syftet med kursen är att studenterna ska få en god överblick och kunskap om ett flertal statistiska tekniker som utvecklats de senaste åren i takt med att datorernas kapacitet ökat. Återsamplingsmetodik, Jack-knife, bootstrap. EM-algoritmen, SIMEX-metodik. Markov Chain Monte Carlo. Slumptalsgeneratorer. Smoothing-tekniker. Kernelskattningar, närmaste granne-skattningar, ortogonala och lokala polynomiella skattningar, wavelet-skattning. Splines. Val av bandbredd och andra parametrar. Tillämpningar och användning av statistisk programvara.
Undervisning
Föreläsningar, räkneövningar och datorlaborationer.
Examination
Kursen examineras genom ett skriftligt prov (8 hp) vid kursens slut samt genom inlämningsuppgifter (2 hp) under kursen enligt anvisningar som lämnas vid kursens start.
Versioner av kursplanen
- Senaste kursplan (giltig från HT 2022)
- Äldre kursplan (giltig från VT 2019)
- Äldre kursplan (giltig från HT 2016)
- Äldre kursplan (giltig från HT 2013)
- Äldre kursplan (giltig från HT 2008, version 2)
- Äldre kursplan (giltig från HT 2008, version 1)
- Äldre kursplan (giltig från HT 2007, version 2)
- Äldre kursplan (giltig från HT 2007, version 1)
Litteratur
Litteraturlista
Gäller från: HT 2016
I bibliotekets söktjänst kan du se om en titel finns elektroniskt.
-
Hastie, Trevor;
Tibshirani, Robert;
Friedman, Jerome
The elements of statistical learning : data mining, inference, and prediction
2. ed.: New York: Springer, 2009