Fuzzy szabálybázis optimalizálás a HFRIQ-learning rendszerben
-
DOI:
https://doi.org/10.32968/psaie.2023.2.9Keywords:
megerősítéses tanulás, heurisztikusan gyorsított megerősítéses tanulás , szakértői tudásbázis, Fuzzy szabály-interpoláció, Q-learning, FRIQ-learningAbstract
A HFRIQ-learning (heurisztikusan gyorsított FRIQ-learning) a ’FIVE’ fuzzy szabály-interpolációs módszeren alapuló Q-tanuló algoritmus, amelybe szakértő által megadott tudásbázis illeszthető fuzzy produkciós szabályok formájában. A tanulási folyamat során a kezdeti szakértői tudásbázist a rendszer optimalizálja olyan módon, hogy ha szükséges, akkor új fuzzy szabálypontot hoz létre, egyébként pedig a meglévő inkrementális szabályrendszert (Q-függvényt) hangolja. A hangolási folyamat során a szabálypontok pozíciója (antecedense és konzekvense) a gradiens módszer alkalmazása következtében a Q-függvény gradiense által módosul. A cikk célja annak bemutatása, hogy a tanulási folyamat során a szabálypontok optimalizálása hogyan valósul meg a HFRIQ-learning rendszerben.