[질문] 업그레이드나 패치시 다운타임을 제로화 하기 위해서 필수요소가 궁금합니다.
서비스 중단 없는 클라우드 운영을 위한 전략으로는 크게 2가지가 있다고 생각합니다.
1. Blue-Green Deployment
두 개의 별도 환경을 준비하여 한 쪽은 실제 서비스, 다른 한 쪽은 업데이트를 진행합니다. 업데이트가 완료되면 트래픽을 업데이트된 새 환경으로 전환합니다.
2. Canary Release
새로운 버전을 일부 사용자에게만 먼저 제공하여 검증하고 이 결과를 분석하여 문제가 없는 것을 확인한 후 전체 사용자에게 업데이트를 확장합니다.
[질문] App Modernization을 통해 TCO 절감을 위해서 구체적으로 거쳐야 하는 단계 내지는 과정은 무엇이 있는지요?
단기적인 절감보다는 장기적인 관점에서 진행을 하면 명확한 TCO에 대한 절감을 목표로 해야한다고 생각합니다.
1. 현재 상태 평가
기존 시스템 분석: 현재 사용중인 애플리케이션과 인프라의 특성과 구조를 파악합니다.
비즈니스 요구사항 분석: 비즈니스 목표와 요구사항을 정확히 이해하고 정리합니다.
2. 전략 수립 및 로드맵 개발
3. 아키텍처 설계 및 데이터 마이그레이션 전략 수립
4. 개발 및 테스팅 환경 구현
5. 운영전환 및 배포,운영인력 훈련 및 지원
6. 운영환경 유지관리 및 최적화
이러한 단계를 거치면서 비용, 시간, 자원 등을 절약하고, 시스템의 효율성과 유연성을 향상시킬 수 있어 TCO를 절감할 수 있습니다.
답변 감사합니다. 답변을 보고 추가로 문의 드리자면, AM을 통해 장기적인 관점에서 TCO 절감이 현행 인프라 대비 얼마나 개선될 수 있는지 어떻게 Estimate 하고 의사결정권자를 설득할 수 있을지 궁금합니다.
1. 오픈소스 활용 개발 or API 연결 개발 둘 중 어느 방식일까요? 2. 회사의 정보를 활용해서 자체 LLM 서비스를 구축하기 위해서 문서(PPT, 엑셀, 워드, PDF, 메일 등)를 파인튜닝 하려고 하면 어떤 방식으로 선행 작업이 진행되어져야 할까요?
[질문] 몽고DB가 스케일아웃을 샤딩을 통해 효과적으로 성능개선을 이루는데 스케일아웃을 구현하는 방식등에서 타 NOSQL과 어떤 차이가 있고 성능상 어느정도 차별화가 되는지 궁금합니다
MongoDB는 샤딩시 여러 기준으로 샤딩을 할 수 있습니다. Range , hash , zone 기반이 가능하고, online 을 이용해 sharding 키를 변경 , 재 생성할 수 도 있습니다.
[질문] RDB는 정규화로 인해 성능, 효율성 문제가 있어 역정규화 과정이 필요하게 되는데... NoSQL도 역정규화 과정이 요구되는지 궁금합니다.
MongoDB는 디자인 패턴 개념이 있습니다. RDBMS 스키마 디자인 하는것처럼 MongoDB도 여러가지 디자인 패턴을 사용할 수 있습니다.
[질문] 데이터사이언스가 분석시 전처리과정과 정규화 과정에 가장 많은 시간을 할내하는데 몽고 db 를 사용하면 이 기간을 줄일수 있는지요 ?
기존에 Rigid한 데이터 모델이 여러 소스에서 오고 , 이를 모아 전처리하는 부분에서 MongoDB Document Model이 적합합니다. 이를 통해 전처리 시간을 줄일 수 있습니다.
[질문]
질문 AI 모델의 하이퍼파라미터를 저장하고 관리할때
성능향상을 주기위해 적용되는 기술이 별도로 있는지 궁금하고
풀 텍스트 검색 기능은 AI 모델의 결과를 검색하고 분석하는 데
부하를 주게 되는지 혹은 부하가 있어도 해소하는 기법이 있는지요
MongoDB Atlas Search의 경우 해당 이슈를 해결 하기 위해 검색 전용 노드를 구성 하여 해결 할 수 있습니다.
[질문]수집된 IOT데이터 분석을 통한 가시성 확보와 분석 속도를 높이고, 데이터 융합과 관련하여 RDBMS와 비교 시, NoSQL 몽고DB의 효율은 얼마나 높은지요?
신규로 제공되어지는 Time series collection 사용시 storage 의 효율은 90% 이상 좋아집니다.
[질문] RDBMS로 분산 처리시 RDBMS는 READ하는 부분은 여러 노드를 둘 수 있지만, WRITE는 하나 뿐이기에 이 부분이 병목으로 작용하여 성능이 안좋다고 하는데, 일관성 부분만 포기하면 RDBMS도 WRITE 노드를 여러개 두어서 보안이 가능한지와 몽고DB에서는 분산처리 성능개선이 어떻게 이루어지는지요?
Write 에 대한 처리는 샤딩을 추가 함으로 처리량을 증가시킬 수 있습니다. RDBMS 여러개의 node에서 write 시에는 write conflict을 고려하셔야 하는 제약이 있습니다.
[질문] 몽고DB가 AI 서비스에 적용될 때, 일반 DB나 비정형 타 DB 대비 성능면에서 얼마나 우위에 있나요?
유연한 json document를 강점이라고 보시면 됩니다. AI training을 위해서 data lake라는 개념을 개발하게 됐는데, 정형화된 RDB만으로 ML training이 불가능하기 때문에 비정형/반정형 데이터를 자유롭게 저장할 수 있는 DL를 도입하게 되었습니다. DL의 제약은 object storage나 plain file들이기 때문에 OLTP에 비해 성능이 떨어져 실시간 AI 서비스 구성에 제약이 있습닌다. MDB의 경우 DataBricks나 BigQuery등과 결합해서 실시간 AI 모델링을 가능하게 하기도 하고, modeling 결과를 flexible model인 json에 저장할 수 있는 장점이 있다고 볼 수 있습니다
[질문] 몽고DB는 운영중인 RDB 환경을 몽고DB 아틀라스로 무중단 이전이 가능한지 궁금하고, 데이터 분석 후 아틀라스로의 원활한 마이그레이션을 위한 연속 동기화 작업을 실행할 수 있는지도 궁금합니다.
MDB6.0부터 relational migrator라는 툴이 preview로 소개되었고 1년 이상 필드에서 검증/보완을 통해 7.0에 GA되었습니다. oracle, mysql, mssql, 등 다양한 RDB의 data (무중단) migration은 물론이고 새 data model을 위해 기존 application code(java, c#, ...)에 적용가능한 model code를 생성해 주는 기능이 있습니다.
X