Reinfocement Learning
-
강화학습(Reinfocement Learning) 정의 및 개념Data Science 2022. 12. 13. 16:33
1. 강화학습(Reinfocement Learning)이란 강화학습이란 Cumulative reward 를 높이기 위해, 특정 환경에서 intelligent agent 가 어떤 action 을 취해야하는 지 연구하는 분야이다. (최적의 policy 찾기) 지도학습이 모델에게 독립변수(x)와 종속변수(y)를 제공하고 학습한다면, 강화학습은 모델에게 state(s)와 reward(r)을 제공하고 학습한다. 강화학습은 아래의 경우 사용하면 좋다. 각 state에 대해서 최적의 행동(optimal action)이 뭔지 모를 때 과정을 모르고 결과에 대한 Reward만 정해줄 수 있을 때 여러 시도 및 실패 과정을 거처도 될 때 강화학습을 그림으로 나타내면 아래와 같다. Agent는 Environment의 어떠한..