Greenplum은 병렬처리 기능을 사용하며 기존의 SQL(postgresql) 그대로 사용이 가능합니다.
병렬처리의 기능은 Json이나 XML 형태의 자료구조 데이타에 대해서도 동일하게 작용하나요? 데이타 포멧의 비균일성과 depth의 차이로 병렬처리가 그리 쉽지 않은 부분으로 생각되는데, 제가 잘못생각한 건가요?
Greenplum 내부에 저장되어 있는 DATA에 대한 병렬처리를 이야기합니다. Json타입이나 XML타입으로 Database의 테이블에 저장된다면 특별한 코딩없이 SQL만으로 병렬처리가 됩니다.
클러스터 구성시 VM당 공유볼륨에 대해 iscsi ip를 설정해야하는데요, 해당 ip설정시 CVM IP와 동일한대역을 써야만 원활한 통신이 되던데요.. CVM과 다른대역으로 공유볼륨ip를 설정했을때는 패킷손실이 났었습니다. 이점은 개선이 되었나요?
이 부분은 네트워크 구성을 어떻게 하엿는지 확인이 필요합니다.
뉴타닉스내에 여러 ip대역이 구성되어 있습니다. (vlan)
vlan 이 아닌, 물리적인 구성, 즉 라우팅등을 확인할 필요가 있습니다. 정확한 구성및 설정에 대한 정보가 없이는 회신을 드리기 힘듭니다. 저희 기술지원팀에 문의해 보셨는지요??
[질문] 그린플럼의 병렬처리 기능을 통해 빅데이터를 빠른 시간에 로딩 및 통계처리가 가능한지 궁금하며, 기존 사용했던 SQL을 그대로 사용하면서 데이터 분석이 가능한지도 궁금합니다.