Kursplan för Datorintensiv statistik och informationsutvinning

Computer-Intensive Statistics and Data Mining

Det finns en senare version av kursplanen.

Kursplan

  • 10 högskolepoäng
  • Kurskod: 1MS009
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Matematik A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå

    • G1N: har endast gymnasiala förkunskapskrav
    • G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    • G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    • G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    • G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    • GXX: kursens fördjupning kan inte klassificeras

    Avancerad nivå

    • A1N: har endast kurs/er på grundnivå som förkunskapskrav
    • A1F: har kurs/er på avancerad nivå som förkunskapskrav
    • A1E: innehåller examensarbete för magisterexamen
    • A2E: innehåller examensarbete för masterexamen
    • AXX: kursens fördjupning kan inte klassificeras

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2007-03-15
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Reviderad: 2013-04-24
  • Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: HT 2013
  • Behörighet:

    120 hp med kursen Regressions- och variansanalys eller motsvarande

  • Ansvarig institution: Matematiska institutionen

Mål

För godkänt betyg på kursen skall studenten kunna

  • redogöra för den teoretiska grunden för Markov Chain Monte Carlo-metoder och använda sådana tekniker för valda statistiska problem;
  • redogöra för principerna för slumptalsgeneratorer;
  • använda simuleringsmetoder som Bootstrap och SIMEX;
  • använda EM-metoder;
  • självständigt använda icke-parametriska statistiska modeller;
  • använda statistisk programvara, företrädesvis R.

Innehåll

Syftet med kursen är att studenterna ska få en god överblick och kunskap om ett flertal statistiska tekniker som utvecklats de senaste åren i takt med att datorernas kapacitet ökat. Återsamplingsmetodik, Jack-knife, bootstrap. EM-algoritmen, SIMEX-metodik. Markov Chain Monte Carlo. Slumptalsgeneratorer. Smoothing-tekniker. Kernelskattningar, närmaste granne-skattningar, ortogonala och lokala polynomiella skattningar, wavelet-skattning. Splines. Val av bandbredd och andra parametrar. Tillämpningar och användning av statistisk programvara.

Undervisning

Föreläsningar, räkneövningar och datorlaborationer.

Examination

Skriftligt provvid kursens slut kombinerat med obligatoriska inlämningsuppgifter och muntlig presentationenligt anvisningar som lämnas vid kursstart.

Litteratur

Litteraturlista

Gäller från: HT 2013

I bibliotekets söktjänst kan du se om en titel finns elektroniskt.

  • Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome The elements of statistical learning : data mining, inference, and prediction

    2. ed.: New York: Springer, 2009

    Se bibliotekets söktjänst