Kursplan för Förstärkningsinlärning

Reinforcement Learning

Det finns en senare version av kursplanen.

  • 7,5 högskolepoäng
  • Kurskod: 1RT747
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Dataanalys A1N, Bildanalys och maskininlärning A1N, Inbyggda system A1N, Datavetenskap A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå

    • G1N: har endast gymnasiala förkunskapskrav
    • G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    • G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    • G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    • G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    • GXX: kursens fördjupning kan inte klassificeras

    Avancerad nivå

    • A1N: har endast kurs/er på grundnivå som förkunskapskrav
    • A1F: har kurs/er på avancerad nivå som förkunskapskrav
    • A1E: innehåller examensarbete för magisterexamen
    • A2E: innehåller examensarbete för masterexamen
    • AXX: kursens fördjupning kan inte klassificeras

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2020-02-27
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: vecka 27, 2020
  • Behörighet: 120 hp inklusive Sannolikhet och statistik, Linjär Algebra II, Envariabelanalys och en fortsättningskurs i programmering. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)
  • Ansvarig institution: Institutionen för informationsteknologi

Mål

Efter godkänd kurs ska studenten kunna:

  • diskutera möjligheter och begränsningar inom förstärkningsinlärning.
  • diskutera kopplingen mellan förstärkningsinlärning och återkopplade system.
  • analysera relevanta tillämpningar, avgöra om de kan formuleras som förstärkningsinlärningsproblem, och i så fall formellt ta fram en sådan formulering.
  • implementera och använda centrala algoritmer för förstärkningsinlärning.
  • analysera och utvärdera algoritmerna via olika prestandamått.
  • implementera, utvärdera och presentera för kursen relevanta metoder från forskningslitteraturen.

Innehåll

Kursen ger en grundlig introduktion till moderna verktyg för att ta fram, implementera och analysera algoritmer för förstärkningsinlärning. Kursen går igenom Markov-beslutsprocesser, återkopplade system, planering via dynamisk programmering, modellfri prediktion och styrning, avvägning mellan prospektering och exploatering, inlärning via funktionsapproximationer och berör även djup förstärkningsinlärning. Bland de tillämpningar som diskuteras under kursen finns klassiska reglerproblem som den inverterade pendeln, men även robotik och datorspel.

Undervisning

Föreläsningar, seminarier, datorlaborationer, projekt.

Examination

Kursen examineras kontinuerligt genom muntlig och skriftlig redovisning av uppgifter (2,5 hp), redovisning av projekt (2 hp), samt genom muntligt prov (3 hp).

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Övriga föreskrifter

Kursen kan ej ingå i samma examen som 1RT745 Förstärkningsinlärning.

Versioner av kursplanen

Litteratur

Uppgift om kurslitteratur saknas. Ta kontakt med ansvarig institution för mer information.