강화 학습 모델 (1) 썸네일형 리스트형 강화 학습 (1) 7-1 강화학습의 개념 시행과 보상을 바탕으로 하는 인공지능 기법 주어진 환경에서 의사결정을 최적화할 때 사용 지도학습, 비지도학습으로 나뉨 지도학습: 랜덤 포레스트, 의사결정 트리, 서포트 벡터 머신 (예측과 식별) 비지도학습: 군집 분석, 연관 관계 분석 (특성 분류) 강화학습: 기계 학습의 기법 중 미래의 가치 극대화(Optimization)를 위한 방법 강화학습은 행동과 보상을 통해 에러를 줄여나가는 방식(Trial and Error)을 사용 행동의 결과가 나중에 보상으로 주어지기 때문에 좋은 행동에 대한 즉각적인 판단이 어려움(Delayed Reward) 7-2 강화학습 기법의 개념 마르코프 결정 과정(MDP, Markov Decision Process): 마르코프 연쇄를 바탕으로 순차적인 행동.. 이전 1 다음