TUDÁSBÁZIS HANGOLÁSA A FRIQ-LEARNING MEGERŐSÍTÉSES TANULÁSI RENDSZERBEN

Authors

  • Tamás Tompa. Miskolci Egyetem
  • Szilveszter Kovács

DOI:

https://doi.org/10.32968/psaie.2022.4.4

Keywords:

megerősítéses tanulás, heurisztikusan gyorsított megerősítéses tanulás, szakértői tudásbázis, tudásbázis hangolás, Q-learning, fuzzy Q-learning

Abstract

A klasszikus megerősítéses tanulási rendszerekben a probléma megoldását leíró tudásbázis ismeretlen a tanulási folyamat kezdetén. Ezen módszerek többsége próbálkozás alapú keresést valósít meg, a környezet visszajelzései alapján térképezi fel a lehetséges megoldást. Azonban, ha rendelkezésre áll részinformáció a probléma megoldására vonatkozóan és az adaptálható a rendszerbe, akkor a tanulási folyamat hatékonysága javítható. A szakértői tudásbázissal bővített Fuzzy szabály-interpoláció alapú Q-tanulás (expert knowledge-included Fuzzy Rule Interpolation-based Q-learning) rendszerben előzetes szakértői információ (szakértői tudásbázis) állapot-akció típusú fuzzy szabályok formájában injektálható a rendszer tanulás folyamatába, amely által a módszer konvergencia sebessége javítható. Azonban, abban az esetben, ha az előzetes szakértői tudásbázis helytelen információkat tartalmaz a megoldásra vonatkozóan, akkor ez negatív hatással lehet a tanulási folyamat hatékonyságára. A cikk célja, egy olyan javasolt hangolási (optimalizálási) eljárás bemutatása, amely a tanulási folyamat során alkalmas lehet a helytelen információkat leíró szakértői fuzzy szabályrendszer hangolására, azaz a fuzzy szabályok állapot-akció pontjának optimalizálására. 

Published

2022-12-12