Kursplan för Datorintensiv statistik och informationsutvinning

Computer-Intensive Statistics and Data Mining

Det finns en senare version av kursplanen.

Kursplan

  • 10 högskolepoäng
  • Kurskod: 1MS009
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Matematik A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå

    • G1N: har endast gymnasiala förkunskapskrav
    • G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    • G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    • G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    • G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    • GXX: kursens fördjupning kan inte klassificeras

    Avancerad nivå

    • A1N: har endast kurs/er på grundnivå som förkunskapskrav
    • A1F: har kurs/er på avancerad nivå som förkunskapskrav
    • A1E: innehåller examensarbete för magisterexamen
    • A2E: innehåller examensarbete för masterexamen
    • AXX: kursens fördjupning kan inte klassificeras

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2007-03-15
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: HT 2007
  • Behörighet:

    Kandidatexamen samt Regressions- och variansanalys eller motsvarande

  • Ansvarig institution: Matematiska institutionen

Mål

För godkänt betyg på kursen skall studenten

  • ha god överblick och kunskap om ett flertal statistiska tekniker som utvecklats de senaste decennierna i takt med att datorernas kapacitet ökat;

  • förstå den teoretiska grunden för Markov Chain Monte Carlo-metoder och kunna använda sådana tekniker för valda statistiska problem;

  • förstå principerna för slumptalsgeneratorer;

  • ha förmåga att använda simuleringsmetoder som Bootstrap och SIMEX;

  • kunna använda datorintensiva icke-linjära statistiska metoder;

  • ha kunskap om EM-metoder;

  • ha kunskaper och färdigheter att självständigt använda icke-parametriska statistiska modeller, speciellt statistiska metoder för informationsutvinning såsom kernelskattningar, närmaste granne-skattningar, ortogonala och lokala polynomiella skattningar, wavelet-skattningar;

  • ha viss erfarenhet av tillämpningar inom bildanalys och finansiell matematik;

  • kunna använda statistisk programvara, företrädesvis R.

    Innehåll

    Återsamplingsmetodik, Jack-knife, bootstrap. Icke-linjära statistiska metoder. EM-algoritmen, SIMEX-metodik. Markov Chain Monte Carlo. Slumptalsgeneratorer. Smoothing-tekniker. Kernelskattningar, närmaste granne-skattningar, ortogonala och lokala polynomiella skattningar, wavelet-skattning. Splines. Val av bandbredd och andra parametrar. Tillämpningar och användning av statistisk programvara.

    Undervisning

    Föreläsningar, räkneövningar och datorlaborationer.

    Examination

    Skriftligt och eventuellt muntligt prov (4 poäng) vid kursens slut samt inlämningsuppgifter och datorlaborationer (6 poäng) under kursen enligt anvisningar som lämnas vid kursstarten.

  • Litteratur

    Litteraturlista

    Gäller från: HT 2007

    I bibliotekets söktjänst kan du se om en titel finns elektroniskt.

    • Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome H. The elements of statistical learning : data mining, inference, and prediction

      New York: Springer, cop. 2001

      Se bibliotekets söktjänst