목록공부 (1)
Grobble
Simple random search provides a competitive approach to reinforcement learning
이 페이퍼는 2018년에 출판되었는데, Abstract를 보면 이 당시에는 policy의 parameter space를 직접 탐험하는 것이 action space를 탐험하는 것보다 훨씬 좋지 않다는 인식이 있었다고 한다. 여기서 소개되는 Augmented Random Search (ARS)는 policy parameter공간을 랜덤하게 탐험하면서 점진적으로 더 좋은 성과를 내도록 설계되어 있는데, 당시 비슷한 시기에 소개된 SAC와 견줄 정도의 sample efficiency를 가지고 있다고 주장된다. Basic Random Search (BRS) 우선 ARS의 전신이 되는 알고리즘으로 Basic Random Search (BRS) 를 간단히 살펴보면, BRS는 각 iteration마다 랜덤한 방향 N개..
공부
2021. 8. 7. 00:32