문제마다 달라질 것이기 때문에 정확한 비율로 얘기하기는 어렵겠지만 데이터파이프라인의 경우가 일반적으로 훨씬 많은 리소스가 소요됩니다. 데이터 파이프라인에서 관리해야 하는 데이터의 양이 더 많기도 하고 데이터의 소스가 추가되거나 운영중 프로그램 변경으로 인해 유입되는 데이터가 약속된 형태에서 바뀌는 등 많은 이슈들이 발생하게 되고 이를 모두 관리하는 데에 많은 툴과 시간을 투자하시게 됩니다.
답변 감사합니다. 현재 소속된 조직에서도 단기적 성과물에 집착해서 앞단인 Data Pipeline에 대해서는 등한시하는 상황입니다. 그래서 실제 실무자들은 앞단에 발목이 잡히거나 일을 위한 일을 양산하고 있지요...
[질문] EDB 버전이 올라가면 버전 업데이트를 할 수 있나요. 업데이트 된 EDB를 별도 구매를 해야 하나요?
서브스크립션 유효기간내에는 무료 업그레이드 가능합니다.
[재질문] mssql always on은 db 복제서비스를 말합니다
replication을 말씀하시는 거라면 EDB Postgres의 Streaming Replication기능으로 가능합니다.
[재질문]소스db장애시 타겟이 소스db가되어 역으로 db복제서비스가 가능한가요?
재구성 해주시면 가능합니다.
구성초기에 옵션으로 양방향 복제서비스가 지원되나요?
양방향 복제는 불가능합니다.
[질문] EDB에서 Group by rollup이나 cube 지원하나요?
버전에 따라 다르지만 최근 버전(EDB Postgres 10) 에선 지원하고 있습니다.
[질문] Postgres에서 옵티마이저에서 Rule base 옵티마이져가 지원 되나요?
Rule base 옵티마이저는 지원되지 않습니다.
[질문] 흔히들 얘기하는게 Data Pipeline 단을 구성하는게 전체 업무의 대부분을 차지한다고 얘기합니다. 오늘 주제인 배포와 운영 관점에서 두 Pipe Line 구성에 어느 정도 비율로 Resource가 할당되어야 할까요?