말씀하신 대로 수평확장을 통한 병렬처리를 통해서 대용량 데이터 처리를 해서 성능을 보장하게 됩니다. RDBMS의 경우 지적하신 제약 외에도 샤딩을 적용하기 위해서는 RDB의 장점인 transaction이나 join을 포기하는 경우도 있습니다.
그에 반해 몽고DB 샤딩은 distributed by design입니다. 대부분 샤딩에서 지원하는 hashed sharding 외에 range sharding, zone sharding까지 지원해서 range query와 data governance도 native support를 하고 있고, chunk rebalancing까지 native support하기 때문에 application 입장에서는 sharding을 사용함에 있어서 크게 차이 없이 개발 생산성을 높일 수 있습니다
[질문] 결국은 Mongo DB의 특성상 Vertical sharding은 어렵지만, 기본적으로 분산된 Horizontal sharding이 이미 구현된 셈이라고 이해해도 될까요?
물론 scale up/down도 무중단으로 자유롭게 조정이 가능하고
scale up으로 한계가 있을 때 scale out을 적용하시는 것이 일반적인 확장 방식입니다
[질문]
사용자 계정 기반 서비스할때
다음 세가지 고민을..
첫째, 한번 로그인해서 여러시스템에 자동적으로 접근해서
사용하면 좋겠는데...
둘째, 다양한 솔루션 시스템에
tenant 및 사용자별로 접근권한을 가지고 통제가 되면 좋겠는데..
세째, 여러 고객사의 사용자관리를 고객사별로 쉽게 구분하면서 안전하게 통합관리하면 좋겠는데...
현실적으로 방법이 있을까요,,
[답변] 안녕하세요?RSA 입니다.
첫째, SSO로 해결하실 수 있습니다.
둘째, 인증 통합 후 네트워크 구간 별 접근제어 정책으로 해결하실 수 있습니다.
셋째, 인증 후 사용자의 정보를 구분하여 접근제어 정책으로 해결하시 수 있습니다.
[질문] 딥러닝 기반 비전 검사 모형은 내부에 있는 현업 담당자가 오류(품질 정도)를 마킹을 해서 데이터를 만들어 주면 된다고 하셨는데, 그렇게 준비해야 하는 데이터의 량이 얼마나 필요할까요? (물론 대상마다 다르겠지만) 해당 비전 모듈을 도입하려면 (비록 전문 비전 프로그래머가 투입되지는 않아서 비용에 대한 세이브는 이미 많이 되었지만 대신에) 현업 담당자의 노력이 들어가야하는데 평균 투입 노력은 어느 정도(몇 M/M or 데이터 건수) 생각해야하나요?
일반적으로 유형별 이미지는 20~50장 정도면 대략 95% 이상의 정밀도의 결과를 예상할 수 있습니다. 학습 데이터는 양보다는 질이 중요합니다.
유형 별로 정제된 학습 셋을 얻는 시간은 상황에 따라 달라서 정량적으로 표현하기는 어려울 듯 합니다.
[질문] 기계를 학습 시킨다면 기계가 올바르게 인식했을때 상을 주고, 잘못 인식했을때 벌을 주는 형태가 되어야 할 건데요. 전문가가 아닌 일반인이 기계를 학습 시키기 위해 어떤 자료를 얼마나 제공해야하고 상벌은 어떻게 줘야 하고 예기치 못한 상황이 발생했을때 어떻게 조치해야 하는 지 등에 대해 어려움 없이 잘 처리 할 수 있을까요..?
산업용은 정확도가 가장 중요한 요소이므로 항상 가장 실력이 좋은 교육자가 교육을 해주어야 좋은 결과를 얻을 수 있습니다. 일반인이 학습한다면 일반인 수준의 결과, 전문가가 학습하면 전문가 수준의 결과가 도출되겠지요.
데이터는 유형별로 약 50 장 이상의 이미지를 제공해 주면 좋습니다.
[질문] 새로운 제품이나 새로운 불량에 대해서는 항상 학습을 시켜야 하나요?
새로운 유형의 불량이라면 학습을 시켜야 합니다. 다만 형태가 변형되는 등의 변화에 대해서는 일반화가 충분히 가능하여 매번 학습할 필요는 없습니다.
[질문]구글 클라우드 데이터랩만의 강점은 무엇인가요?
Google Cloud 의 Cloud Service Resource 를 쉽게 연동하여 사용할 수 있다는게 큰 강점입니다.
클라우드는 처음이라...
데이터는 일반 운영데이터를 적재 분석 및 시각화를 하게 되는건가요?
네, 적재 된 데이터를 datalab 을 이용하여 시각화 하는 것입니다.
[질문]NoSQL이 대량 데이터 처리에 대한 RDBMS의 한계를 해결하기위해 나왔는데 구체적으로 어떤 점에서 성능적 차이가 나타나는지 궁금하며 RDBMS가 샤딩이 가능하지만 샤딩 처리를 위해 어플리케이션 레벨에서 처리해야하는 부분이 있는것이 단점인데 이부분이 몽고DB에서는 성능적으로 얼마나 개선되었는지궁금합니다