주요한 포인트를 이미 알고 계신 것 같습니다. DB내에서 직접 고급분석 ML/DL(pl/python, pl/pytho 등) 을 할 수 있습니다.
https://rfriend.tistory.com/635
예? 그 엄청난양의 데이타를 DB내의 모든 데이타에 대해서 분석한다구요? 그런 결코 효율적일 수 없는데요. MAP-Reduce가 나온 이유가 그것이기도 하구요.
[질문] 클라우드라고 하면 무조건 공기관 제안영업에 철옹성 같은 벽이 큽니다. 도입에 필요한 데모와 Certi 그리고 동등 보장성이 증명되어야 해서 참 어렵습니다. 이에 대한 영업 사례등을 일부 공개나 소개 부탁합니다.
[질문] 일반적으로 데이터 분석을 위해서는 데이터웨어하우스(DW)나 데이터레이크에서 데이터를 추출해서 워크스테이션에서 머신러닝을 돌리고, 데이터를 모두 워크스테이션으로 가져올 수 없으니 데이터를 샘플링하게 되고, 샘플 데이터가 이동하는 과정에서 속도도 저하되고, 전체 데이터를 분석하는 것이 아니라 분석 품질이 떨어질 가능성도 있어 보입니다. 그린플럼은 이런 이슈 없이 샘플데이터를 추출하지 않고 DB내에서 데이터를 직접 분석 할 수 있는지 궁금하며, 만약 가능하다면 전체 데이터가 분석 대상이 되어 데이터 이동 시간도 필요 없을 것 같은데 어떤지 궁금합니다.