• avatar
    2024-04-24 stephan

    [질문]Non parametric에 대해 공부중입니다. 처음 접하는 개념이라 질문사항이 몇가지가 있습니다.
    1) 인공지능 붐이 일어나기 전과 후 non parametric에서 대세가 되고 있는 이론이 있나요?
    2) 혹시 가우시안과 베이지안 프로세스가 현재 인공지능 붐의 대세인가요?
    3) 가우시안 프로세스는 오래전에 나온 이론인데, 딥러닝이 활성화되면서 예전과 어떤 차이점이 있는지 궁금합니다.
    RNN등으로 인해, 산출되는 값이 많이 바뀌기 시작한 것인가요?
    추가로 질문하나만 더 드립니다. 기존에 non parametric이라고 칭하던게 현재 딥러닝에서 구사하는 unsupervised 개념이 맞는 것인지요? 또한 시계열과 가우시안 프로세스는 같은 방식의 코딩인가요?
    성실한 답변 부탁드립니다.

  • avatar
    2024-04-24 kyungmo.yang

    안녕하십니까. 앤시스 코리아 양경모입니다.
    1. 인공지능 붐이 일어나기 전과 후에도 여러 이론과 방법론이 발전하고 있습니다. Non-parametric 방법론은 그 중 하나입니다. 이 방법론은 데이터에 대한 가정 없이 모델을 구축하는 방식으로, 특히 데이터의 분포를 가정하지 않는 통계적 방법을 말합니다.
    여기서 몇 가지 주목할만한 non-parametric 이론과 방법론을 소개해 드리겠습니다:
    - K-최근접 이웃 (K-Nearest Neighbors, KNN)
    - 커널 밀도 추정 (Kernel Density Estimation, KDE)
    - 비모수적 가설 검정 (Non-parametric Hypothesis Testing)
    - 부트스트레핑 (Bootstrap)
    - 로우스톤 테스트 (Runs Test)

  • avatar
    2024-04-24 kyungmo.yang

    2. 현재 인공지능 분야에서 가우시안 프로세스와 베이지안 프로세스는 주목받고 있는 중요한 기술입니다.

    가우시안 프로세스 (Gaussian Process):
    가우시안 프로세스는 확률론적 모델링 방법으로, 불확실성을 추정하고 함수를 모델링하는 데 사용됩니다.
    하이퍼파라미터 최적화에 활용되며, 목표 함수의 불확실성을 고려하여 최적값을 찾습니다.
    예를 들어, 인공지능 모델의 하이퍼파라미터 조정에 활용됩니다.
    베이지안 프로세스 (Bayesian Process):
    베이지안 프로세스는 베이지안 확률론에 기반한 순차적 최적화 전략을 사용합니다.
    목표 함수의 불확실성을 추정하고, 이를 기반으로 하이퍼파라미터 최적값을 찾아냅니다.
    정보보안 분야에서도 AISecurity와 관련하여 베이지안 기술이 적용 가능성을 가지고 있습니다.
    이러한 기술들은 인공지능 붐에서 중요한 역할을 하고 있으며, 더 많은 연구와 응용이 기대됩니다.

  • avatar
    2024-04-24 kyungmo.yang

    가우시안 프로세스(Gaussian Process, GP)는 확률적인 모델링 방법으로, 데이터의 분포를 추론하는데 사용됩니다. 이론적으로는 오래전부터 존재했지만, 딥러닝이 활성화되면서 다양한 차이점이 나타났습니다.
    딥러닝과 가우시안 프로세스의 차이점:
    - 딥러닝은 신경망 구조를 사용하며, 많은 뉴런과 레이어로 복잡한 함수를 근사합니다.
    - 가우시안 프로세스는 확률적인 함수를 직접 모델링하며, 평균 함수와 공분산 함수를 사용합니다.
    - 딥러닝은 대량의 데이터를 필요로 합니다. 많은 샘플이 있을 때 성능이 향상됩니다.
    - 가우시안 프로세스는 적은 데이터로도 유연하게 모델링할 수 있습니다.
    - 가우시안 프로세스는 불확실성을 확률적으로 다루기 때문에 예측에 대한 불확실성을 제공합니다.
    - 딥러닝은 불확실성을 직접 다루지 않고, 예측값만 제공합니다.
    - 가우시안 프로세스에서 커널 함수는 데이터 간의 상관 관계를 정의합니다.
    딥러닝에서는 커널 함수 대신 활성화 함수를 사용합니다

  • avatar
    2024-04-24 kyungmo.yang

    RNN은 시계열 데이터와 순차적인 데이터를 모델링하는데 사용됩니다.
    가우시안 프로세스는 시간에 따른 불확실성을 다루는데 유용합니다.
    따라서 RNN과 가우시안 프로세스는 서로 보완적인 역할을 합니다.

  • avatar
    2024-04-24 kyungmo.yang

    현재 딥러닝에서 non-parametric이라는 용어는 unsupervised 학습과 관련하여 사용됩니다. 이 개념은 라벨 없는 데이터를 활용하여 모델을 훈련하는 방식을 의미합니다. Non-parametric 방법은 파라미터의 수를 고정하지 않고 데이터에 따라 유연하게 모델을 구성하는 방식입니다. 이는 클러스터링 (예: K-means)이나 차원 축소 (예: PCA)와 같은 전통적인 비지도 학습 방법과도 관련이 있습니다.

    시계열과 가우시안 프로세스는 다른 개념입니다. 시계열은 시간에 따라 변화하는 데이터를 다루는 것으로, 예측, 분류 또는 패턴 인식과 같은 작업에 사용됩니다. 반면 가우시안 프로세스는 확률적 모델로, 데이터의 분포를 모델링하고 예측하는 데 사용됩니다. 이 두 개념은 서로 다른 방식으로 코딩되며, 시계열 데이터를 다루는 경우 시계열 모델링 기법을 사용하고, 가우시안 프로세스를 적용할 때는 해당 프로세스를 구현하는 방식을 따릅니다.


  • avatar
    2023-02-09 박창민

    (질문) 설계 담당 엔지니어가 직접 중복제거, 아웃라이어 제거, 데이터 보완 및 검증 과정을 거쳐 정제 작업을 히는 경우 시간이 많이 소요되는데, 이 경우 시간을 획기적으로 단축될 수 있는 방안으로 제시해주실 것은 무엇이 있습니까?

  • avatar
    2023-02-09 JH2023

    보통 데이터 preparation 단계를 데이터사이언스 워크스테이션에서 실행하는 경우가 많은데, 그린플럼의 기본적인 쿼리 사용만으로 병렬처리가 되어 데이터 이동없이 이런 전처리 시간을 단축시켜줍니다. 필요시 PL/R, PL/Python으로도 SQL 쿼리에서 제공하지 않는 로직도 병렬 처리됩니다.


  • avatar
    2023-02-09 앵그리파파

    [질문] 그린플럼의 MPP 아키텍처는 하나의 서버 안에서 여러개의 DB 프로세스가 독립적으로 병렬 처리가 가능한지 궁금합니다.

  • avatar
    2023-02-09 VMware 이상희

    그린플럼은 여러개 서버를 통합적으로 병렬처리하고, 또한 한 서버 안에 보통 8개 DB 프로세스가 있습니다. 그래서 4개 데이터 노드일 경우에는 4*8 해서 32개 DB 프로세스가 구동된다고 보시면 됩니다. 8노드이면 8*8 = 64개 프로세스가 독립적으로 수행됩니다.

  • avatar
    2023-02-09 aster9448

    [질문] 그렇다면 서버의 CPU 갯수가 성능에 미치는 영향이 좀 크겠네요? 처리하는 데이타의 양을 생각하면 GPU 활용이 성능에 미치는 영향은 어떠한가요?


  • avatar
    2023-02-09 jack1003

    [질문]MPP기반의 분석툴이면 다양한 원본소스들의 데이타가 적재된 데이터레이크의 대용량데이터를 분석을 위해서 COPY에서 사용해야할것 같은데, 분석 처리에 시간이 많이 걸리지 않을까요? 외부저장소를 연결하여 사용도 가능할까요?

  • avatar
    2023-02-09 VMware 이상희

    Copy 대신 PXF를 이용해서 데이터 조회/적재를 합니다. 아래 링크 참조 부탁드립니다.
    http://gpdbkr.blogspot.com/search/label/GPDB6_PXF_S3%EC%97%B0%EB%8F%99


  • avatar
    2023-02-09 sboat123

    [질문] 데이터레이크와 그린플럼 간의 데이터 연계에는 pxf라는 기술이 사용되는 것으로 아는데 이 pxf기술에 대해 간략하게 설명 부탁드립니다.

  • avatar
    2023-02-09 VMware 이상희

    http://gpdbkr.blogspot.com/search/label/GPDB6_PXF_S3%EC%97%B0%EB%8F%99

  • avatar
    2023-02-09 sboat123

    오 아주 유익한 정보가 많네요..그린플럼에 대해 좀 더 자세히 알수 잇을 것 같네요. 감사합니다.


  • avatar
    2023-02-09 한나조

    [질문] 코딩을 잘 모르더라도 그림플럼을 이용해서 데이터 분석이 가능한지 궁금하고, 비전공 신입직원이 사용법을 배우려면 권장되는 시간은 얼마나 될까요?

  • avatar
    2023-02-09 세계쵝오대용량디비그린플럼

    프로그래머가 만든 프로그램을 Greenplum에 적용 시킬 수 있다는 것을 강조 드리며, 습득력은 개인역량에 따라 다를것 같습니다.


  • avatar
    2023-02-09 [이호승]

    [질문] 데이터의 품질관리가 어려운데 데이터마이닝을 통해 고품질의 데이터를 생성하는 기능도 제공되는지 궁금하고 AWS 에서 발생되는 데이터를 연동해서 사용하는 사례도 있는지 궁금합니다.

  • avatar
    2023-02-09 JH2023

    CNGone에서 수행했던 모 유통업체 분석DW사업에서 클라우드에서 발생하는 마케팅 데이터 로그를 DW의 데이터와 연동하여 분석하는 사례를 가지고 있습니다.


  • avatar
    2023-02-09 양재영

    [질문]In-Database 에서 데이터의 이동 없이 초대용량 데이터를 효율적으롷 분산병렬처리로 분석, 기계학습을 하기위해 가장 선행되고 중요한 선작업은 어떤게 필요한지요?

  • avatar
    2023-02-09 세계쵝오대용량디비그린플럼

    Data 저장단계에서 MPP 서버 전체에 DATA부분부터 잘 분산되어 저장되어야 됩니다.


  • avatar
    2023-02-09 한국

    [질문] 그린플럼 분석 ML알고리즘을 선택하는 방법이 데이터사이언스 수준인가요? 현업자도 사용 가능한 수준이 될까요?

  • avatar
    2023-02-09 JH2023

    데이터사이언티스트의 스킬셋에 따라 적합한 방식을 선택할 수 있겠습니다. 모델 개발이 가능하신 분은 PL/R, PL/Python 을 주로 사용하고, SQL쿼리에서 빌트인된 SQL함수 형태로 쓰는 방식은 조금 스킬셋이 떨어져도 사용이 가능한 방식입니다.


  • avatar
    2023-02-09 양재영

    [질문]데이터레이크와 그린플럼은 함께 활용하면 유용할것 같은데 데이터레이트와 그린플럼의 시너지 활용법은 어떤게 있을까요?

  • avatar
    2023-02-09 JH2023

    가장 일반적인 활용법이 데이터레이크에서 1차 데이터 정제 후 그린플럼에서 사용자 서비스를 하는 것이 대표적입니다. 데이터레이크를 콜드 데이터 보관이나 정제되지 않은 raw데이터 보관, 백업의 기능으로 활용하고 서비스 영역이나 데이터 분석 영역을 그린플럼으로 구분하는 아키텍처를 많이 사용하고 있습니다.


  • avatar
    2023-02-09 PowerGom

    [질문] 타 데이터 분석 플랫폼과 비교해서 가장 강점은 무엇인가요?

  • avatar
    2023-02-09 VMware 이상희

    1.성능입니다. 모든 것이 병렬 처리됩니다. 쿼리 병렬 처리, 적재 병렬 처리, Python, R 도 병렬처리가 됩니다.
    2.베어메탈, 퍼블릭 클라우드, 프라이빗 클라우드에서도 사용할 수 있습니다.


  • avatar
    2023-02-09 아리랑

    stream data(events, flows) 와 Batch data(logs, files 등) 상호 병합하여 분석용 데이터셋 적용 시 효용성이 높은지?

  • avatar
    2023-02-09 JH2023

    스트림 데이터 적재시에 사전에 정의한 배치 프로시저를 호출하는 형태로 적재 작업을 구성하면 적재와 병합처리까지 한번에 처리됩니다.


  • avatar
    2023-02-09 양재영

    [질문]그린플럼 데이터 플랫폼으로 일반적인 분석 방법에서 대용량 분석이 힘들고 데이터가 존재하는 곳에서 분석 서버(SAS, Python)으로 데이터 전송 필요하고, 대용량이기 때문에 서버의 메모리 및 CPU 한계 발생하는것에 대한 해결방안이 궁금합니다.

  • avatar
    2023-02-09 VMware 이상희

    SAS, 파이썬 같은 분석 서버에서는 한개의 서버에서 수행되지만, 파이썬 스크립트를 Greenplum으로 실행하게 되면 여러 노드에서 병렬 수행되기 때문에 분산 처리할 수 있어 한 서버의 메모리, CPU 한계를 해결할 수 있습니다.


  • avatar
    2023-01-15 박병주

    no-code가 이론적으로 아주 유용하고 개발자가 아닌 일반 업무 전무가가 스스로 팰용한 프로그램을 만들면서 필요한 리즈를 충분하는데 아주 효과적인데 깊이 들어가면 또 개바이 필요한데 이럴때는 개발을 할 수 있는 하이브리드형태의 no-code가 필요할 것 같은데 kt 솔루션은 이런 형태를 지원하는것인가요?


  • avatar
    2023-01-09 태영님

    메타버스 서비스, 플랫폼 등 실제 사회/인프라/소셜관계를 반영하는 세계관 또는 서비스를 구현하기 위해서는 오감을 자극할 수 있는 360도 VR, 스테레오 사운드 등 Reality 기술이 중요해 보입니다만, 데이터 경량화, 어지러움 등 경제적 / 사용자 경험 이슈를 극복하는 것이 쉽지 않아 보입니다. 이런 기술적 완성도 미확보 단계에서도 재미적 요소 제페토와 같은 메타버스 서비스 외 사업이 빠른 시일 내 성장할 것이라고 생각하시는지, 기술역량확보보다 중요한 것이 무엇이라고 생각하시는지요?


  • avatar
    2022-11-22 전영진000

    [질문] 챗봇이 실제로 얼마나 효과적으로 고객 요청에 응대하는지 측정하기가 쉽지 않다고 느낄 때가 많이 있습니다. 코어AI는 고객들 중에서 제품에 실제로 관심을 가지고 있는 고객을 정확히 찾을 수 있도록 돕는다고 하셔서 고객 응대의 효과성을 측정하는 방법이 함께 제공되는 것 같은데 어떤 방법이 가능한지 그리고 코어AI 데모를 진행하는 동안 그러한 효과성의 측정 결과를 제공받을 수 있는지 궁금합니다.

  • avatar
    2022-11-22 코어에이아이

    대화형 AI를 통해 직접 사용자가 입력한 자연어들을 분석할 수 있게 Kore.ai 에서는 Conversation Dashboard를 지원하고 있습니다. 실제 사용을 통해 사용자들이 입력한 자연어들을 분석하여 고객 응대의 효과를 측정하고 효과가 좋지 않다면 Update를 통해 고객 요청을 받아들일 수 있습니다.

  • avatar
    2022-11-22 전영진000

    [질문] 답변 주셔서 고맙습니다. 고객 요청을 받아들이기 위한 Update는 일반적으로 어떤 형태로 진행이 되나요?


  • avatar
    2022-11-22 Kall

    [질문] 같은 산업 같은 직무라면 한 가지 맵을 응용해서 사용하는 경우가 있나요?

  • avatar
    2022-11-22 코어에이아이

    Kore.ai는 금융 및 이커머스, 헬스케어등 다양한 산업에 대한 경험을 바탕으로 업종별 특화 솔루션인 HR, IT, Sales, Smart 및 Work 어시스턴트를 제공합니다. 또한 향후 제공예정인 봇스토어를 통해 사용자는 이미 업무에 특화된 봇을 일부 수정하여 회사에 신속하게 적용 할 수 있습니다.


  • avatar
    2022-11-22 rokace22

    질문] 대화형 AI와 RPA와 챗봇을 상호 보완적으로 활용할 수 있는 방법은 무엇인가요?

  • avatar
    2022-11-22 코어에이아이

    챗봇의 대화를 대화형 AI가 보조해주고 대화형 AI는 대화를 판단하여 RPA를 실행시키고 결과를 받아서 챗봇에 결과를 보여주는 방법을 추천드립니다.


  • avatar
    2022-11-22 Alex55

    [질문] Kore.ai의 대화형 AI에 AI/ML 기술이 적용되어 있을텐데, AI/ML 기술도 Kore.ai에서 직접 개발한 것인가요? 아니면 어떤 AI/ML 기술이 적용된 건가요?

  • avatar
    2022-11-22 Kore.ai

    코어에이아이의 NLU 엔진은 ML/FM/KG등 멀티엔진 접근 방식을 사용하고 있으며 자체 NLP 팀이 엔진 성능을 업그레이드 하고 있습니다.


  • avatar
    2022-11-22 어러주클

    [질문] 현재 대화형 AI가 지원하고 있는 업무분야는 몇개정도가 될까요? 제가 있는분야는 여행관련 예약 분야입니다. 항공,호텔,투액,패키지 등등입니다. 어렵겠지만
    해당분야 관련 트레이닝 기간은 어느정도 걸릴까요?

  • avatar
    2022-11-22 Kore.ai

    질의응답의 갯수와 대화 시나리오의 갯수와 난이도에 따라 차이가 나긴 하지만 최근 저희가 만든 사례중에 항공권 예약 하는 시나리오 1개의 경우 아마데우스와 연계 하여 2주정도 소요되었습니다.


  • avatar
    2022-11-22 Alex55

    [질문] 대화형 AI가 상호 주고 받는 식의 질문(대화)를 통해 이루어지나요?
    즉, 구체적인 사항이 필요할때 RPA쪽에서 추가 질문이 필요할 수 있는 상항이 있을텐데요..

  • avatar
    2022-11-22 코어에이아이

    대화를 통해 이루어지기 때문에 RPA쪽에서 추가 질문을 요청하면 사용자가 응답을 통해 질의 응답을 진행 할 수 있습니다.