Fuzzy szabálybázis optimalizálás a HFRIQ-learning rendszerben

-

Authors

  • Tamás Tompa. Miskolci Egyetem
  • Szilveszter Kovács Miskolci Egyetem

DOI:

https://doi.org/10.32968/psaie.2023.2.9

Keywords:

megerősítéses tanulás, heurisztikusan gyorsított megerősítéses tanulás , szakértői tudásbázis, Fuzzy szabály-interpoláció, Q-learning, FRIQ-learning

Abstract

A HFRIQ-learning (heurisztikusan gyorsított FRIQ-learning) a ’FIVE’ fuzzy szabály-interpolációs módszeren alapuló Q-tanuló algoritmus, amelybe szakértő által megadott tudásbázis illeszthető fuzzy produkciós szabályok formájában. A tanulási folyamat során a kezdeti szakértői tudásbázist a rendszer optimalizálja olyan módon, hogy ha szükséges, akkor új fuzzy szabálypontot hoz létre, egyébként pedig a meglévő inkrementális szabályrendszert (Q-függvényt) hangolja. A hangolási folyamat során a szabálypontok pozíciója (antecedense és konzekvense) a gradiens módszer alkalmazása következtében a Q-függvény gradiense által módosul. A cikk célja annak bemutatása, hogy a tanulási folyamat során a szabálypontok optimalizálása hogyan valósul meg a HFRIQ-learning rendszerben.

 

Downloads

Published

2023-11-30