• avatar
    2023-03-16 rokace22

    질문] 가상화와 HCI 사이의 상관관계에 대해서 설명 부탁드립니다

  • avatar
    2023-03-16 뉴타닉스 코리아

    가상화의 핵심기술인 하이퍼바이저는 x86 HW의 컴퓨팅 자원을 VM에 할당하고 관리하는 역할을 하며 공유 스토리지를 통해 데이터를 저장하는데 HCI는 공유 스토리지까지 소프트웨어 정의 스토리지 기술을 통해 별도의 공유스토리지 없이 기업의 가상화 인프라를 단순화하고 서버+가상화+스토리지의 관리를 통합하는 장점을 제공합니다.


  • avatar
    2023-03-16 aster9448

    [질문] 배포와 provisoning이 하루라는 건 무슨 의미인가요? 이건 분 혹은 초 단위로 가능해야 하는 것 아닌가요?

  • avatar
    2023-03-16 뉴타닉스 코리아

    컨테이너와 달리 VM은 운영체제와 App, Data를 모두 포함하므로 배포되는 수량에 따라 수 분~수 시간이 소요됩니다. Nutanix는 이러한 VM 기반의 배포 환경에서 자체 기술을 사용하여 빠른 시간에 대량의 VM 배포를 제공합니다.

  • avatar
    2023-03-16 뉴타닉스코리아 신득성

    서비스 업무 배포(Web,WAS,DB 등)를 말씀드리는 내용입니다. 해당 서비스를 배포하기 위해서는 서버, 네트워크, 스토리지 구성이 필요한데, Nutanix 사용하면 신속한 배포를 제공하고 있습니다.

  • avatar
    2023-03-16 aster9448

    아, 그러니까 단순한 EC2 같은 것의 provision 뿐 아니라, WAS, DB, super pod, pods를 포함한 완결된 전체 환경의 프러비져닝이란 말씀으로 이해하겠습니다.


  • avatar
    2023-03-16 sboat123

    [질문] vmware의 vcenter가 통합관리가 되서 편리한데 이 vcenter에서 아크로폴리스도 관리가 되는지 궁금하고 그 반대로 프리즘에서 vsphere를 관리할수 있는지요 ?

  • avatar
    2023-03-16 뉴타닉스 코리아

    네, 반대의 경우인 Nutanix의 통합 관리도구 Prism을 통해 기존 vSphere 인프라의 통하 관리를 제공합니다.



  • avatar
    2023-02-09 gomin

    [질문] 그린플럼이 postgresql 기반의 DB근간인데, 오픈소스 버전보다 추가로 지원하는 기능들이 궁금합니다

  • avatar
    2023-02-09 VMware 이상희

    Greenplum도 오픈소스, 상용버전 두개가 있습니다. 오픈소스는 Greenplum DB엔진이며, 상용버전은 DB엔진과, 모니터링 툴, kafka/spark 등의 커넥터 들을 지원합니다.


  • avatar
    2023-02-09 김민경

    [질 문] 포스트그레SQL과 그린플럼의 차이점은 무었인가요?

  • avatar
    2023-02-09 VMware 이상희

    Postgresql은 OLTP용 Database이며, 그린플럼은 Postgresql을 병렬로 처리하는 솔루션입니다. 그래서 Greenplum 코어 엔진은 postgresql 를 이용합니다.


  • avatar
    2023-02-09 박창민

    (질문) 설계 담당 엔지니어가 직접 중복제거, 아웃라이어 제거, 데이터 보완 및 검증 과정을 거쳐 정제 작업을 히는 경우 시간이 많이 소요되는데, 이 경우 시간을 획기적으로 단축될 수 있는 방안으로 제시해주실 것은 무엇이 있습니까?

  • avatar
    2023-02-09 JH2023

    보통 데이터 preparation 단계를 데이터사이언스 워크스테이션에서 실행하는 경우가 많은데, 그린플럼의 기본적인 쿼리 사용만으로 병렬처리가 되어 데이터 이동없이 이런 전처리 시간을 단축시켜줍니다. 필요시 PL/R, PL/Python으로도 SQL 쿼리에서 제공하지 않는 로직도 병렬 처리됩니다.


  • avatar
    2023-02-09 앵그리파파

    [질문] 그린플럼의 MPP 아키텍처는 하나의 서버 안에서 여러개의 DB 프로세스가 독립적으로 병렬 처리가 가능한지 궁금합니다.

  • avatar
    2023-02-09 VMware 이상희

    그린플럼은 여러개 서버를 통합적으로 병렬처리하고, 또한 한 서버 안에 보통 8개 DB 프로세스가 있습니다. 그래서 4개 데이터 노드일 경우에는 4*8 해서 32개 DB 프로세스가 구동된다고 보시면 됩니다. 8노드이면 8*8 = 64개 프로세스가 독립적으로 수행됩니다.

  • avatar
    2023-02-09 aster9448

    [질문] 그렇다면 서버의 CPU 갯수가 성능에 미치는 영향이 좀 크겠네요? 처리하는 데이타의 양을 생각하면 GPU 활용이 성능에 미치는 영향은 어떠한가요?


  • avatar
    2023-02-09 jack1003

    [질문]MPP기반의 분석툴이면 다양한 원본소스들의 데이타가 적재된 데이터레이크의 대용량데이터를 분석을 위해서 COPY에서 사용해야할것 같은데, 분석 처리에 시간이 많이 걸리지 않을까요? 외부저장소를 연결하여 사용도 가능할까요?

  • avatar
    2023-02-09 VMware 이상희

    Copy 대신 PXF를 이용해서 데이터 조회/적재를 합니다. 아래 링크 참조 부탁드립니다.
    http://gpdbkr.blogspot.com/search/label/GPDB6_PXF_S3%EC%97%B0%EB%8F%99


  • avatar
    2023-02-09 sboat123

    [질문] 데이터레이크와 그린플럼 간의 데이터 연계에는 pxf라는 기술이 사용되는 것으로 아는데 이 pxf기술에 대해 간략하게 설명 부탁드립니다.

  • avatar
    2023-02-09 VMware 이상희

    http://gpdbkr.blogspot.com/search/label/GPDB6_PXF_S3%EC%97%B0%EB%8F%99

  • avatar
    2023-02-09 sboat123

    오 아주 유익한 정보가 많네요..그린플럼에 대해 좀 더 자세히 알수 잇을 것 같네요. 감사합니다.


  • avatar
    2023-02-09 한나조

    [질문] 코딩을 잘 모르더라도 그림플럼을 이용해서 데이터 분석이 가능한지 궁금하고, 비전공 신입직원이 사용법을 배우려면 권장되는 시간은 얼마나 될까요?

  • avatar
    2023-02-09 세계쵝오대용량디비그린플럼

    프로그래머가 만든 프로그램을 Greenplum에 적용 시킬 수 있다는 것을 강조 드리며, 습득력은 개인역량에 따라 다를것 같습니다.


  • avatar
    2023-02-09 [이호승]

    [질문] 데이터의 품질관리가 어려운데 데이터마이닝을 통해 고품질의 데이터를 생성하는 기능도 제공되는지 궁금하고 AWS 에서 발생되는 데이터를 연동해서 사용하는 사례도 있는지 궁금합니다.

  • avatar
    2023-02-09 JH2023

    CNGone에서 수행했던 모 유통업체 분석DW사업에서 클라우드에서 발생하는 마케팅 데이터 로그를 DW의 데이터와 연동하여 분석하는 사례를 가지고 있습니다.


  • avatar
    2023-02-09 양재영

    [질문]In-Database 에서 데이터의 이동 없이 초대용량 데이터를 효율적으롷 분산병렬처리로 분석, 기계학습을 하기위해 가장 선행되고 중요한 선작업은 어떤게 필요한지요?

  • avatar
    2023-02-09 세계쵝오대용량디비그린플럼

    Data 저장단계에서 MPP 서버 전체에 DATA부분부터 잘 분산되어 저장되어야 됩니다.


  • avatar
    2023-02-09 한국

    [질문] 그린플럼 분석 ML알고리즘을 선택하는 방법이 데이터사이언스 수준인가요? 현업자도 사용 가능한 수준이 될까요?

  • avatar
    2023-02-09 JH2023

    데이터사이언티스트의 스킬셋에 따라 적합한 방식을 선택할 수 있겠습니다. 모델 개발이 가능하신 분은 PL/R, PL/Python 을 주로 사용하고, SQL쿼리에서 빌트인된 SQL함수 형태로 쓰는 방식은 조금 스킬셋이 떨어져도 사용이 가능한 방식입니다.


  • avatar
    2023-02-09 양재영

    [질문]데이터레이크와 그린플럼은 함께 활용하면 유용할것 같은데 데이터레이트와 그린플럼의 시너지 활용법은 어떤게 있을까요?

  • avatar
    2023-02-09 JH2023

    가장 일반적인 활용법이 데이터레이크에서 1차 데이터 정제 후 그린플럼에서 사용자 서비스를 하는 것이 대표적입니다. 데이터레이크를 콜드 데이터 보관이나 정제되지 않은 raw데이터 보관, 백업의 기능으로 활용하고 서비스 영역이나 데이터 분석 영역을 그린플럼으로 구분하는 아키텍처를 많이 사용하고 있습니다.


  • avatar
    2023-02-09 PowerGom

    [질문] 타 데이터 분석 플랫폼과 비교해서 가장 강점은 무엇인가요?

  • avatar
    2023-02-09 VMware 이상희

    1.성능입니다. 모든 것이 병렬 처리됩니다. 쿼리 병렬 처리, 적재 병렬 처리, Python, R 도 병렬처리가 됩니다.
    2.베어메탈, 퍼블릭 클라우드, 프라이빗 클라우드에서도 사용할 수 있습니다.


  • avatar
    2023-02-09 아리랑

    stream data(events, flows) 와 Batch data(logs, files 등) 상호 병합하여 분석용 데이터셋 적용 시 효용성이 높은지?

  • avatar
    2023-02-09 JH2023

    스트림 데이터 적재시에 사전에 정의한 배치 프로시저를 호출하는 형태로 적재 작업을 구성하면 적재와 병합처리까지 한번에 처리됩니다.


  • avatar
    2023-02-09 양재영

    [질문]그린플럼 데이터 플랫폼으로 일반적인 분석 방법에서 대용량 분석이 힘들고 데이터가 존재하는 곳에서 분석 서버(SAS, Python)으로 데이터 전송 필요하고, 대용량이기 때문에 서버의 메모리 및 CPU 한계 발생하는것에 대한 해결방안이 궁금합니다.

  • avatar
    2023-02-09 VMware 이상희

    SAS, 파이썬 같은 분석 서버에서는 한개의 서버에서 수행되지만, 파이썬 스크립트를 Greenplum으로 실행하게 되면 여러 노드에서 병렬 수행되기 때문에 분산 처리할 수 있어 한 서버의 메모리, CPU 한계를 해결할 수 있습니다.


  • avatar
    2023-01-15 박병주

    no-code가 이론적으로 아주 유용하고 개발자가 아닌 일반 업무 전무가가 스스로 팰용한 프로그램을 만들면서 필요한 리즈를 충분하는데 아주 효과적인데 깊이 들어가면 또 개바이 필요한데 이럴때는 개발을 할 수 있는 하이브리드형태의 no-code가 필요할 것 같은데 kt 솔루션은 이런 형태를 지원하는것인가요?