Kursplan för Datorintensiv statistik och informationsutvinning

Computer-Intensive Statistics and Data Mining

Kursplan

  • 10 högskolepoäng
  • Kurskod: 1MS009
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Matematik A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå

    • G1N: har endast gymnasiala förkunskapskrav
    • G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    • G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    • G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    • G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    • GXX: kursens fördjupning kan inte klassificeras

    Avancerad nivå

    • A1N: har endast kurs/er på grundnivå som förkunskapskrav
    • A1F: har kurs/er på avancerad nivå som förkunskapskrav
    • A1E: innehåller examensarbete för magisterexamen
    • A2E: innehåller examensarbete för masterexamen
    • AXX: kursens fördjupning kan inte klassificeras

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2007-03-15
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Reviderad: 2021-10-15
  • Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: HT 2022
  • Behörighet: 120 hp. Regressionsanalys genomgången. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
  • Ansvarig institution: Matematiska institutionen

Mål

Efter godkänd kurs ska studenten kunna:

  • redogöra för den teoretiska grunden för Markov Chain Monte Carlo-metoder och använda sådana tekniker för valda statistiska problem;
  • redogöra för principerna för slumptalsgeneratorer;
  • använda simuleringsmetoder som Bootstrap och SIMEX;
  • använda EM-metoder;
  • självständigt använda icke-parametriska statistiska modeller;
  • använda statistisk programvara, företrädesvis R.

Innehåll

Syftet med kursen är att studenterna ska få en god överblick och kunskap om ett flertal statistiska tekniker som utvecklats de senaste åren i takt med att datorernas kapacitet ökat. Återsamplingsmetodik, Jack-knife, bootstrap. EM-algoritmen, SIMEX-metodik. Markov Chain Monte Carlo. Slumptalsgeneratorer. Smoothing-tekniker. Kernelskattningar, närmaste granne-skattningar, ortogonala och lokala polynomiella skattningar, wavelet-skattning. Splines. Val av bandbredd och andra parametrar. Tillämpningar och användning av statistisk programvara.

Undervisning

Föreläsningar, räkneövningar och datorlaborationer.

Examination

Kursen examineras genom ett skriftligt prov (8 hp) vid kursens slut samt genom inlämningsuppgifter (2 hp) under kursen enligt anvisningar som lämnas vid kursens start.

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Litteratur

Litteraturlista

Gäller från: HT 2022

I bibliotekets söktjänst kan du se om en titel finns elektroniskt.

  • Zwanzig, Silvelyn; Mahjani, Behrang Computer intensive methods in statistics

    Boca Raton: CRC Press, [2020]

    Se bibliotekets söktjänst