말씀하신 대로 수평확장을 통한 병렬처리를 통해서 대용량 데이터 처리를 해서 성능을 보장하게 됩니다. RDBMS의 경우 지적하신 제약 외에도 샤딩을 적용하기 위해서는 RDB의 장점인 transaction이나 join을 포기하는 경우도 있습니다.
그에 반해 몽고DB 샤딩은 distributed by design입니다. 대부분 샤딩에서 지원하는 hashed sharding 외에 range sharding, zone sharding까지 지원해서 range query와 data governance도 native support를 하고 있고, chunk rebalancing까지 native support하기 때문에 application 입장에서는 sharding을 사용함에 있어서 크게 차이 없이 개발 생산성을 높일 수 있습니다
[질문] 결국은 Mongo DB의 특성상 Vertical sharding은 어렵지만, 기본적으로 분산된 Horizontal sharding이 이미 구현된 셈이라고 이해해도 될까요?
물론 scale up/down도 무중단으로 자유롭게 조정이 가능하고
scale up으로 한계가 있을 때 scale out을 적용하시는 것이 일반적인 확장 방식입니다
시각화 Tool을 활용할 때 가장 어려운 점 중의 하나는 Data Source로부터 대량의 분석 대상자료를 선별해서 가져올 때 소요시간 등과 관련된 문제입니다. Oracle Visualization Tool은 이 부분을 어떻게 지원하고 있는지요
가능합니다. 데이터를 선별해서 가져오는 과정은 시각화 도구에서 'Data Flow'를 활용하거나 Data Set을 생성할 때 '필터'를 적용할 수 있습니다. 또한 직접 SQL로 해당데이터를 선별하여 가져올 수 있습니다.
데이터 시각화 솔루션(클라우드, 데스트탑 버젼)의 사용 비용은 어떻게 되나요? 예를 들어 A사의 경우 Free Tier로 무료 사용기간이 있어서요.
클라우드 버전은 시간당 $1.34부터 시작하며, 자세한 내용은 아래링크를 참고하거나, 담당영업대표를 통해 연락해 주십시오.
https://cloud.oracle.com/en_US/oac/pricing
데스크탑 버전은 ADW(Autonomous Data Warehouse)를 사용하시는 고객은 무료로 사용할 수 있습니다.
Oracle Visualization Tool을 Oracle DB 기반의 Data 분석에 사용할 경우 다른 상용 DB와 연동해서 사용하는 경우와 비교할 때 유리한 점들이 있는지요.
ADW(Autonomous Data Warehouse)는 분석 업무에 최적화되어 있고, Oracle Exadata 기반의 서비스이기 때문에 다른 사용DB와 연동하는 것보다 성능면에서 매우 유리합니다.
[질문]NoSQL이 대량 데이터 처리에 대한 RDBMS의 한계를 해결하기위해 나왔는데 구체적으로 어떤 점에서 성능적 차이가 나타나는지 궁금하며 RDBMS가 샤딩이 가능하지만 샤딩 처리를 위해 어플리케이션 레벨에서 처리해야하는 부분이 있는것이 단점인데 이부분이 몽고DB에서는 성능적으로 얼마나 개선되었는지궁금합니다