Kursplan för Förstärkningsinlärning

Reinforcement Learning

Kursplan

  • 7,5 högskolepoäng
  • Kurskod: 1RT747
  • Utbildningsnivå: Avancerad nivå
  • Huvudområde(n) och successiv fördjupning: Dataanalys A1N, Bildanalys och maskininlärning A1N, Inbyggda system A1N, Datavetenskap A1N

    Förklaring av koder

    Koden visar kursens utbildningsnivå och fördjupning i förhållande till andra kurser inom huvudområdet och examensfordringarna för generella examina:

    Grundnivå

    • G1N: har endast gymnasiala förkunskapskrav
    • G1F: har mindre än 60 hp kurs/er på grundnivå som förkunskapskrav
    • G1E: innehåller särskilt utformat examensarbete för högskoleexamen
    • G2F: har minst 60 hp kurs/er på grundnivå som förkunskapskrav
    • G2E: har minst 60 hp kurs/er på grundnivå som förkunskapskrav, innehåller examensarbete för kandidatexamen
    • GXX: kursens fördjupning kan inte klassificeras

    Avancerad nivå

    • A1N: har endast kurs/er på grundnivå som förkunskapskrav
    • A1F: har kurs/er på avancerad nivå som förkunskapskrav
    • A1E: innehåller examensarbete för magisterexamen
    • A2E: innehåller examensarbete för masterexamen
    • AXX: kursens fördjupning kan inte klassificeras

  • Betygsskala: Underkänd (U), godkänd (3), icke utan beröm godkänd (4), med beröm godkänd (5)
  • Inrättad: 2020-02-27
  • Inrättad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Reviderad: 2022-02-04
  • Reviderad av: Teknisk-naturvetenskapliga fakultetsnämnden
  • Gäller från: HT 2022
  • Behörighet:

    120 hp inklusive Sannolikhet och statistik, Linjär Algebra II, Envariabelanalys och en fortsättningskurs i programmering. Engelska 6. (Med en svensk kandidatexamen uppfylls kravet på engelska.)

  • Ansvarig institution: Institutionen för informationsteknologi

Mål

Efter godkänd kurs ska studenten kunna:

  • förklara möjligheter och begränsningar inom förstärkningsinlärning,
  • förklara kopplingen mellan förstärkningsinlärning och återkopplade system,
  • analysera relevanta tillämpningar, avgöra om de kan formuleras som förstärkningsinlärningsproblem, och i så fall formellt ta fram en sådan formulering,
  • implementera, använda och utvärdera centrala algoritmer för förstärkningsinlärning,
  • implementera, utvärdera och presentera för kursen relevanta metoder från forskningslitteraturen.

Innehåll

Kursen ger en grundlig introduktion till moderna verktyg för att ta fram, implementera och analysera algoritmer för förstärkningsinlärning. Kursen går igenom Markov-beslutsprocesser, återkopplade system, planering via dynamisk programmering, modellfri prediktion och styrning, avvägning mellan prospektering och exploatering, funktionsapproximationer och policy-gradientmetoder, och berör även djup förstärkningsinlärning. Bland de tillämpningar som diskuteras under kursen finns klassiska reglerproblem som den inverterade pendeln, men även robotik och datorspel.

Undervisning

Föreläsningar, seminarier, datorlaborationer, projekt.

Examination

Kursen examineras kontinuerligt genom muntlig och skriftlig redovisning av uppgifter (2 hp), redovisning av projekt (2.5 hp), samt genom skriftligt prov (3 hp).

Om särskilda skäl finns får examinator göra undantag från det angivna examinationssättet och medge att en enskild student examineras på annat sätt. Särskilda skäl kan t.ex. vara besked om särskilt pedagogiskt stöd från universitetets samordnare för studenter med funktionsnedsättning.

Övriga föreskrifter

Kursen kan ej ingå i samma examen som 1RT745 Förstärkningsinlärning.

Litteratur

Litteraturlista

Gäller från: HT 2022

I bibliotekets söktjänst kan du se om en titel finns elektroniskt.

  • Sutton, Richard S.; Barto, Andrew G. Reinforcement learning : an introduction

    Second edition: Cambridge, MA: The MIT Press, [2018]

    Se bibliotekets söktjänst