DGX Cloud의 주된 워크로드는 몇 달 간 집중적으로 학습이 필요한 LLM과 같은 대규모 모델 학습일 것입니다. 조금 더 작은 분, 시간 단위의 과금 모델이 DGX Cloud에는 재하지 않고, 해당 모델이 필요하신 경우 기존 CSP에서 GPU instance를 활용하시는 것도 좋은 방법이실 것 같습니다.
클러스터 구성시 VM당 공유볼륨에 대해 iscsi ip를 설정해야하는데요, 해당 ip설정시 CVM IP와 동일한대역을 써야만 원활한 통신이 되던데요.. CVM과 다른대역으로 공유볼륨ip를 설정했을때는 패킷손실이 났었습니다. 이점은 개선이 되었나요?
이 부분은 네트워크 구성을 어떻게 하엿는지 확인이 필요합니다.
뉴타닉스내에 여러 ip대역이 구성되어 있습니다. (vlan)
vlan 이 아닌, 물리적인 구성, 즉 라우팅등을 확인할 필요가 있습니다. 정확한 구성및 설정에 대한 정보가 없이는 회신을 드리기 힘듭니다. 저희 기술지원팀에 문의해 보셨는지요??
DGX Cloud 가 월단위 계약이 좋기도 하지만 매일 full 로 사용하기가 어려울것 같습니다. 물론 학습을 할 때는 열심히 돌아가지만 저렇게 큰 사양의 메모리를 다 쓰게 하려면 쉽지 않을것 같습니다. 좀 더 작은 사용 단위 과금 모델은 없을까요?