말씀하신 대로 수평확장을 통한 병렬처리를 통해서 대용량 데이터 처리를 해서 성능을 보장하게 됩니다. RDBMS의 경우 지적하신 제약 외에도 샤딩을 적용하기 위해서는 RDB의 장점인 transaction이나 join을 포기하는 경우도 있습니다.
그에 반해 몽고DB 샤딩은 distributed by design입니다. 대부분 샤딩에서 지원하는 hashed sharding 외에 range sharding, zone sharding까지 지원해서 range query와 data governance도 native support를 하고 있고, chunk rebalancing까지 native support하기 때문에 application 입장에서는 sharding을 사용함에 있어서 크게 차이 없이 개발 생산성을 높일 수 있습니다
[질문] 결국은 Mongo DB의 특성상 Vertical sharding은 어렵지만, 기본적으로 분산된 Horizontal sharding이 이미 구현된 셈이라고 이해해도 될까요?
물론 scale up/down도 무중단으로 자유롭게 조정이 가능하고
scale up으로 한계가 있을 때 scale out을 적용하시는 것이 일반적인 확장 방식입니다
쇼핑몰에서 사용하기에 적절할지 궁금합니다. 상품검색이나 구매시 쿼리속도가 느리면 이탈율이 커질텐데요~ 쿼리의 복잡성은 거의 없기때문에 누적 데이터가 쌓여도 인덱싱 관리가 잘되어 최적화에 문제가 없을지 궁금합니다.
빅쿼리는 굉장히 큰 규모의 데이터를 빠르게 처리해서 결과를 전달해주는 것이 목적입니다. 따라서 빠른 응답 처리 또는 굉장히 큰 규모의 트래픽을 수용해야 한다면, 구글 클라우드의 빅테이블을 고려하시는 것이 좋습니다. 빅테이블에 대한 정보는 https://cloud.google.com/bigtable/에서 확인하시기 바랍니다.
[질문] 베트남소재의 몇개 지점과 데이터를 송.수신하는 것을 가정해서 GCP를 이용하는 방법을 설명해주실수 있을 까요?
베트남 소재의 몇개 지점에서 구글 클라우드 네트워크의 인터넷 연결 접점인 PoP까지는 인터넷 망을 이용해서 통신을 하고, PoP 이후 데이터가 실제로 위치한 데이터 센터까지의 통신은 구글 내부의 네트워크를 사용하여 통신할 것입니다. 따라서 글로벌하게 네트워크가 준비되지 않았다면 실제 데이터 센터까지 인터넷으로 통신하기 때문에, 상대적으로 통신 속도를 빠르게 이용할 수 있다는 장점이 있습니다.
*** A사 솔루션을 호주에서 사용하고 있는데요. Region에 따라 속도의 차이가 발생하고 있는데, 담당자들이 인정하지 않고, 실제 어떤것이 문제이고 해결책을 정확하게 이야기 하지 못해주더라구요. GCP는 이런 부분이 해소될수 있는지 궁금합니다.
리전 간 속도 차이는 물리적인 지역이 다르게 때문에 발생할 수 밖에 없습니다. 다만, 그 속도 차이가 얼마나 발생할 수 있느냐의 차이라고 보이는데, 구글 클라우드가 보유한 네트워크 환경으로 그 속도 차이를 굉장히 많이 줄일 수 있다는 것이 장점입니다.
[질문]NoSQL이 대량 데이터 처리에 대한 RDBMS의 한계를 해결하기위해 나왔는데 구체적으로 어떤 점에서 성능적 차이가 나타나는지 궁금하며 RDBMS가 샤딩이 가능하지만 샤딩 처리를 위해 어플리케이션 레벨에서 처리해야하는 부분이 있는것이 단점인데 이부분이 몽고DB에서는 성능적으로 얼마나 개선되었는지궁금합니다