[질문] Value-Based learning의 경우 일반적으로 큰 Action space에는 사용이 불가능하고 Policy-Based learning의 경우 high dimensional action space, continuous action space에 모두 사용할수있다고 하는데.. 어떤 차이점때문에 Policy-Based의 경우 큰 action space에도 학습이 가능한건가요? stochastic한 policy의 학습이 가능하기때문에 생각해야하는건가요?
[질문] 성공적인 XDR 전략을 위해서는 클라우드, 엔드포인트, 네트워크와 같은 다양한 보안 그룹 간의 사일로를 단순히 훌륭한 XDR 솔루션 도입으로 허물 수 있을지요? 사람과 프로세스도 이에 맞춰 발전해야 할 것 같은데요. 지속적인 지원이 가능할지요? 내재화되기까지 시간이 상당히 걸릴꺼 같은데요.
[질문] Value-Based learning의 경우 일반적으로 큰 Action space에는 사용이 불가능하고
Policy-Based learning의 경우 high dimensional action space, continuous action space에 모두 사용할수있다고 하는데..
어떤 차이점때문에 Policy-Based의 경우 큰 action space에도 학습이 가능한건가요? stochastic한 policy의 학습이 가능하기때문에 생각해야하는건가요?