Tudásbázis redukálás a heurisztikusan gyorsított FRIQ-learning rendszerben

Authors

  • Tamás Tompa. Miskolci Egyetem
  • Szilveszter Kovács

DOI:

https://doi.org/10.32968/psaie.2023.2.1

Keywords:

megerősítéses tanulás, heurisztikusan gyorsított megerősítéses tanulás, Q-learning, Fuzzy Q-learning, szakértői tudásbázis, tudásbázis redukálás

Abstract

A megerősítéses tanulási módszerek tudásbázis leírási formája eltérő. A heurisztikusan gyorsított Fuzzy szabály-interpoláció alapú Q-tanulás (Heuristically Accelerated Fuzzy Rule-Interpolation based Q-learning - HFRIQ-learning) rendszerben a tanulási folyamat során létrejövő tudásbázis egy ritka fuzzy szabálybázis által reprezentált, amely az állapot-akció formátumú szakértői szabályok megadása következtében külső információkat tartalmazhat a probléma megoldására vonatkozóan. A HFRIQ-learning módszer szabálybázis építési és hangolási eljárása következtében előfordulhat olyan eset, hogy több szabálypont egymáshoz közel kerül a fuzzy szabálybázis hangolása (szabálypontok vándorlása) miatt. Az állapot-akció-Q-érték univerzumban egymáshoz közel elhelyezkedő szabályok nagyon hasonló információt írnak le, amely következtében az alapötlet, hogy ezen szabályok összevonásával (egyesítésével) a szabályrendszer mérete csökkenthető. Jelen cikk célja egy olyan javasolt fuzzy szabálybázis csökkentési módszer bemutatása, amely alkalmas lehet a fuzzy szabályok között értelmezhető távolság alapján történő szabálybázis redukálására (szabály összevonásra) a tanulási folyamat során.

Downloads

Published

2023-02-07