grid world 썸네일형 리스트형 간단한 코드로 이해하는 강화학습 #3 Grid World-2 (정책, 가치 함수, 학습) 저번 강의에 이어서 진행되는 내용이다. 실제 학습이 이루어지는 강화 학습을 인공지능을 만들어보자.지난 강의에서 우리는 Grid World를 만들었다. 그리고 거기서 제멋대로 움직이는 에이전트를 개발했다. 아래 코드는 그 에이전트가 학습을 해서 이젠 올바른 경로를 찾도록 한 것이다. import numpy as npclass GridWorld: def __init__(self, size=4): self.size = size self.terminal_states = [(0, 3)] self.actions = ['U', 'D', 'L', 'R'] self.reset() def reset(self): self.state = (0, 0) .. 더보기 이전 1 다음