Szakértői heurisztika alkalmazása a FRIQ-learning megerősítéses tanulási módszerben
DOI:
https://doi.org/10.35925/j.multi.2019.4.35Kulcsszavak:
megerősítéses tanulás, Q-learning, fuzzy szabály-interpoláció, fuzzy Q-learning, szakértői tudásbázisAbsztrakt
Jelen cikk szakértői tudásbázis, mint előzetes, a priori heurisztika alkalmazási lehetőségét és annak hatását mutatja be a FRIQ-learning megerősítéses tanulási módszerben. A megerősítéses tanulási módszerek többsége, mint ahogyan a FRIQ-learning rendszer is üres tudásbázissal indítja a tanulási folyamatot, majd egy megfelelően meghatározott jutalomfüggvény alapján inkrementálisan bővíti azt. A cikk bemutatja a FRIQ-learning algoritmus továbbfejlesztett verzióját, amely esetében a rendszer nem üres tudásbázissal indítja a tanulási fázist, hanem egy szakértő által megadott, előzetes tudásbázissal. A bemutatott módszer segítségével az előzetes szakértői heurisztika beágyazható az FRIQ-learning módszerbe. Továbbá a cikk a népszerű „mountain car” mintapéldán keresztül szemlélteti a szakértői tudásbázis beágyazásának módját és hatását a rendszerre.