Kursplan för Datorintensiv statistik och informationsutvinning

Computer-Intensive Statistics and Data Mining

Kursplan

  • 10 högskolepoäng
  • Kurskod: 1MS009
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Matematik A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå
    G1N: har endast gymnasiala förkunskapskrav
    G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    GXX: kursens fördjupning kan inte klassificeras.

    Avancerad nivå
    A1N: har endast kurs/er på grundnivå som förkunskapskrav
    A1F: har kurs/er på avancerad nivå som förkunskapskrav
    A1E: innehåller examensarbete för magisterexamen
    A2E: innehåller examensarbete för masterexamen
    AXX: kursens fördjupning kan inte klassificeras.

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2007-03-15
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Reviderad: 2018-08-30
  • Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: vecka 24, 2019
  • Behörighet: 120 hp med Regressionsanalys eller motsvarande.
    Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
  • Ansvarig institution: Matematiska institutionen

Mål

Efter godkänd kurs ska studenten kunna:

  • redogöra för den teoretiska grunden för Markov Chain Monte Carlo-metoder och använda sådana tekniker för valda statistiska problem;
  • redogöra för principerna för slumptalsgeneratorer;
  • använda simuleringsmetoder som Bootstrap och SIMEX;
  • använda EM-metoder;
  • självständigt använda icke-parametriska statistiska modeller;
  • använda statistisk programvara, företrädesvis R.

Innehåll

Syftet med kursen är att studenterna ska få en god överblick och kunskap om ett flertal statistiska tekniker som utvecklats de senaste åren i takt med att datorernas kapacitet ökat. Återsamplingsmetodik, Jack-knife, bootstrap. EM-algoritmen, SIMEX-metodik. Markov Chain Monte Carlo. Slumptalsgeneratorer. Smoothing-tekniker. Kernelskattningar, närmaste granne-skattningar, ortogonala och lokala polynomiella skattningar, wavelet-skattning. Splines. Val av bandbredd och andra parametrar. Tillämpningar och användning av statistisk programvara.

Undervisning

Föreläsningar, räkneövningar och datorlaborationer.

Examination

Kursen examineras genom ett skriftligt prov (8 hp) vid kursens slut samt genom inlämningsuppgifter (2 hp) under kursen enligt anvisningar som lämnas vid kursens start. 

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Litteratur

Litteraturlista

Gäller från: vecka 50, 2019

  • Zwanzig, Silvelyn; Mahjani, Behrang Computer intensive methods in statistics

    Boca Raton: CRC Press, [2020]

    Se bibliotekets söktjänst

Silvelyn Zwanzig, Behrang Mahjani Computer Intensive Methods in Statistics Chapman and Hall/CRC 2019 ISBN 9780367194239 - CAT# K417734

Versioner av litteraturlistan