Autopilot 을 사용하시면 결과물중에 하나가 전처리을 진행할 수 있는 Notebook 파일이 생성됩니다. 당연히 데이터셋마다 Notebook 파일의 내용이 바뀌겠죠. 이런 경험들은 이런 결과물을 보시거나 책/Kaggle 등에서 많이 보시고 고민하고 하셔야 하는 부분이라고 판단됩니다.
(고수분들의) 많은 분들의 의견이 실제 훈련은 중요하지 않고 데이터를 찾고 전처리 하는것이 가장 중요하고 그것이 80% 이상의 작업이라는 말씀을 많이 하십니다.
클러스터 구성시 VM당 공유볼륨에 대해 iscsi ip를 설정해야하는데요, 해당 ip설정시 CVM IP와 동일한대역을 써야만 원활한 통신이 되던데요.. CVM과 다른대역으로 공유볼륨ip를 설정했을때는 패킷손실이 났었습니다. 이점은 개선이 되었나요?
이 부분은 네트워크 구성을 어떻게 하엿는지 확인이 필요합니다.
뉴타닉스내에 여러 ip대역이 구성되어 있습니다. (vlan)
vlan 이 아닌, 물리적인 구성, 즉 라우팅등을 확인할 필요가 있습니다. 정확한 구성및 설정에 대한 정보가 없이는 회신을 드리기 힘듭니다. 저희 기술지원팀에 문의해 보셨는지요??
[질문] Data Preparation에 사실 많은 시간이 소요되는데, 이를 위한 노하우나 지원 도구들이 어떤 것들이 있을까요?