보통 데이터 preparation 단계를 데이터사이언스 워크스테이션에서 실행하는 경우가 많은데, 그린플럼의 기본적인 쿼리 사용만으로 병렬처리가 되어 데이터 이동없이 이런 전처리 시간을 단축시켜줍니다. 필요시 PL/R, PL/Python으로도 SQL 쿼리에서 제공하지 않는 로직도 병렬 처리됩니다.
[질문] VM과 컨데어너의 가장 큰 차이점은 GUEST os의 유무인데 이 GUEST OS가 무겁고 이에 대한 화환성에 문제가 있어서 인것으로 생각되는데 컨테이너가 수만개 만들어서 그것은 관리하기가 어려운데 컨데이터의 구성요소를 좀 더 늘리고 그 수를 줄여서 관리를 좀 더 쉽게 할 수 있는 방안은 없는지요?
(질문) 설계 담당 엔지니어가 직접 중복제거, 아웃라이어 제거, 데이터 보완 및 검증 과정을 거쳐 정제 작업을 히는 경우 시간이 많이 소요되는데, 이 경우 시간을 획기적으로 단축될 수 있는 방안으로 제시해주실 것은 무엇이 있습니까?