Alkalmazáspéldák a hfriq-learning rendszerben
-
DOI:
https://doi.org/10.32968/psaie.2023.2.7Keywords:
megerősítéses tanulás, heurisztikusan gyorsított megerősítéses tanulás, szakértői tudásbázis, Fuzzy szabály-interpoláció, Q-learningAbstract
A heurisztikusan gyorsított FRIQ-learning (HFRIQ-learning) a ’FIVE’ fuzzy szabály-interpolációs modellen alapuló Q-tanuló módszer, amely alkalmas külső szakértői tudásbázis (mint szakértői heurisztika) injektálásra a rendszerbe. A beágyazott szakértői tudásbázis gyorsíthatja a tanulási folyamatot, de abban az esetben, ha ez az a priori tudásbázis helytelen információt tartalmaz, akkor az negatívan hathat a tanulási folyamat hatékonyságára. A HFRIQ-learning rendszerben a tudásbázist (Q-függvényt) egy állapot-akció-Q-érték formájú ritka (fuzzy szabály-interpolált) szabálybázis írja le, amely következtében a külső szakértői tudásbázis állapot-akció formájú fuzzy produkciós szabályok által adható meg. A cikk célja, hogy klasszikus megerősítéses tanulási mintapéldákon keresztül demonstrálja a HFRIQ-learning rendszerbe injektált szakértői tudásbázis hatását a tanulási folyamatra illetve annak bemutatása, hogy a rendszer hogyan valósítja meg a helytelen szakértői szabályok hangolását (optimalizálását).