Greenplum 안에서 R/Python 함수를 호출하여 사용할 수 있습니다. ML/DL 라이브러리를 병렬로 처리가 가능합니다. 일반적으로 싱글 프로세스로 파이썬, R를 수행하는데, 이에 반해 Greenplum에서는 병렬 프로세스로 수행되기 때문에 병렬도에 따라 선형적으로 속도개선이 됩니다. 참고로 작은 클러스터는 4대 기준으로 했을 때 32배 정도 개선됩니다. 서버 수가 많아지면 더 빨라집니다.
성능이 가장 중요할 것이라 생각됩니다. 대용량 데이터 가공/처리에 많은 리소스를 사용하기 때문에 병렬 처리되는 아키텍처가 필수 이지 않을 까 생각됩니다.
안녕하세요.