ozone은 데이터의 저장 뿐만 아니라 이를 활용한 데이터의 활용도 중요합니다. CDP는 자사가 가지고 있는 ozone의 데이터를 활용할 수 있는 임팔라와 같은 다양한 컴포넌트를 제공하고 있습니다.
클라우데라는 속도 뿐만 아니라, 사용자들에게 data lake의 데이터를 쉽게 활용할수 있도록 데이터 거버넌스, 카탈로그를 제공하며, 또한 데이터를 안전하게 지킬수 있도록 다양한 보안 컴포넌트를 제공합니다. 마지막으로 데이터에 대해서 수집부터 가공/처리/집계 뿐만 아니라 이를 이용한 시각화 및 데이터 분석까지 데이터의 활용에 대한 모든 기능을 제공합니다.
CDP는 대용량 데이터의 빠른 처리 및 가공에 대한 노하우 뿐만 아니라 데이터 거버넌스 / 카탈로그 / 리니지를 제공하여 사용자에게 현재 data lake가 가지고 있는 데이터에 활용성을 증대할 수 있는 다양한 기능을 제공합니다.
private cloud는 publc과 bare metal의 장점이 조합 되어 있습니다. public cloud의 편리성, 확장성과 기존 스토리지의 안정성과 데이터에 대한 오너쉽을 함께 활용하실수 있습니다.
bare metal 환경에서는 rhel과 centos, ubuntu 등의 다양한 OS를 지원하며, PRIVATE CLOUD의 경우는 현재 Openshift를 통한 서비스만을 제공하고 있습니다. https://docs.cloudera.com/cdp-private-cloud-base/7.1.5/installation/topics/cdpdc-os-requirements.html f
Openshift 위에서 동작하는 CDP Private Cloud를 사용하기 위해서는 별도의 라이센스가 필요하며, 더욱 자세한 정보는 클라우데라 코리아에게 문의부탁드립니다.
CDP는 OpenShift의 신속한 확장 기능을 활용한 오토 스케일링 기능을 제공하고 있으며, 이를 통해 대규모 음성 데이터 유입에 따라 최적화된 컴퓨팅 파워를 제공합니다.
cdp는 운영과 관계된 컴포넌트(일부 어드민 기능 제외)에 대해서 고가용성을 보장하며, 이를 통해 특정 노드/인스턴스의 장애에 대해서 서비스와 데이터에 대한 연속성을 보장합니다.
데이터 분석을 위해서는 데이터 분석 뿐만 아니라 데이터의 수집부터 가공, 처리, 그리고 이를 이용한 집계까지 전처리가 모두 이루어진 후에 가능한 작업이며, 클라우데라는 수집부터 ML/AI까지의 데이터 관련 라이프사이클 전체를 제공하고 있습니다.
안녕하세요. 웨비나에 참여해주셔서 감사드립니다.