말씀하시는 바와 같이 ML 은 '데이터셋' 부터 '배포/서비스/모니터링' 까지 엄청남 노력과 반복작업입니다. Feature Engineering 을 하게 되면 다시 HPO 진행하셔야 한다는점 미리 말씀드립니다.
엄청나게 Engineering 을 진행한 데이터셋이 있다고 가정하였을때 제가 사용하려는 알고리즘 (예, xgboost) 을 선택하면 알고리즘의 static parameter 를 고정하시고 tuning 할 parameter 을 정의하시면 됩니다. Tuning 하려는 parameter 별로 range 을 주시면 HPO 후에 해당 range 에서 어떤 값이 가장 Best 다라고 결과가 나옵니다.
추가로 한번 HPO 후 완료하는 것이 아니라 range 을 처음에는 조금 크게, 그 다음은 조금 작게...이런식으로 몇번을 하시는것을 추천드립니다.
[질문] 기존까지 모델 튜닝은 시행착오 방식으로 진행이 되었고. 해보고 안되면 다른 대안을 찾는 식이었는데요. 그러나 세이지메이커는 이른바 HPO 방식을 사용하여 간단한 클릭만으로 훈련 모델의 여러 복사본이 만들어지고, 머신러닝을 이용해 각 변화를 동시에 검토하여, 이 검토 결과에 따라 변수를 튜닝을 하는데요, HPO 방식에 관한 설명을 요청 드립니다.