Szakértői heurisztika alkalmazása a FRIQ-learning megerősítéses tanulási módszerben

Szerzők

  • Tompa Tamás Miskolci Egyetem
  • Kovács Szilveszter Miskolci Egyetem

DOI:

https://doi.org/10.35925/j.multi.2019.4.35

Kulcsszavak:

megerősítéses tanulás, Q-learning, fuzzy szabály-interpoláció, fuzzy Q-learning, szakértői tudásbázis

Absztrakt

Jelen cikk szakértői tudásbázis, mint előzetes, a priori heurisztika alkalmazási lehetőségét és annak hatását mutatja be a FRIQ-learning megerősítéses tanulási módszerben. A megerősítéses tanulási módszerek többsége, mint ahogyan a FRIQ-learning rendszer is üres tudásbázissal indítja a tanulási folyamatot, majd egy megfelelően meghatározott jutalomfüggvény alapján inkrementálisan bővíti azt. A cikk bemutatja a FRIQ-learning algoritmus továbbfejlesztett verzióját, amely esetében a rendszer nem üres tudásbázissal indítja a tanulási fázist, hanem egy szakértő által megadott, előzetes tudásbázissal. A bemutatott módszer segítségével az előzetes szakértői heurisztika beágyazható az FRIQ-learning módszerbe. Továbbá a cikk a népszerű „mountain car” mintapéldán keresztül szemlélteti a szakértői tudásbázis beágyazásának módját és hatását a rendszerre.

##submission.downloads##

Megjelent

2020-06-20