Alkalmazáspéldák a hfriq-learning rendszerben

-

Authors

  • Tamás Tompa. Miskolci Egyetem
  • Szilveszter Kovács Miskolci Egyetem

DOI:

https://doi.org/10.32968/psaie.2023.2.7

Keywords:

megerősítéses tanulás, heurisztikusan gyorsított megerősítéses tanulás, szakértői tudásbázis, Fuzzy szabály-interpoláció, Q-learning

Abstract

A heurisztikusan gyorsított FRIQ-learning (HFRIQ-learning) a ’FIVE’ fuzzy szabály-interpolációs modellen alapuló Q-tanuló módszer, amely alkalmas külső szakértői tudásbázis (mint szakértői heurisztika) injektálásra a rendszerbe. A beágyazott szakértői tudásbázis gyorsíthatja a tanulási folyamatot, de abban az esetben, ha ez az a priori tudásbázis helytelen információt tartalmaz, akkor az negatívan hathat a tanulási folyamat hatékonyságára. A HFRIQ-learning rendszerben a tudásbázist (Q-függvényt) egy állapot-akció-Q-érték formájú ritka (fuzzy szabály-interpolált) szabálybázis írja le, amely következtében a külső szakértői tudásbázis állapot-akció formájú fuzzy  produkciós szabályok által adható meg. A cikk célja, hogy klasszikus megerősítéses tanulási mintapéldákon keresztül demonstrálja a HFRIQ-learning rendszerbe injektált szakértői tudásbázis hatását a tanulási folyamatra illetve annak bemutatása, hogy a rendszer hogyan valósítja meg a helytelen szakértői szabályok hangolását (optimalizálását).   

Downloads

Published

2023-11-30