안녕하십니까. 앤시스 코리아 양경모입니다.
1. 인공지능 붐이 일어나기 전과 후에도 여러 이론과 방법론이 발전하고 있습니다. Non-parametric 방법론은 그 중 하나입니다. 이 방법론은 데이터에 대한 가정 없이 모델을 구축하는 방식으로, 특히 데이터의 분포를 가정하지 않는 통계적 방법을 말합니다.
여기서 몇 가지 주목할만한 non-parametric 이론과 방법론을 소개해 드리겠습니다:
- K-최근접 이웃 (K-Nearest Neighbors, KNN)
- 커널 밀도 추정 (Kernel Density Estimation, KDE)
- 비모수적 가설 검정 (Non-parametric Hypothesis Testing)
- 부트스트레핑 (Bootstrap)
- 로우스톤 테스트 (Runs Test)
2. 현재 인공지능 분야에서 가우시안 프로세스와 베이지안 프로세스는 주목받고 있는 중요한 기술입니다.
가우시안 프로세스 (Gaussian Process):
가우시안 프로세스는 확률론적 모델링 방법으로, 불확실성을 추정하고 함수를 모델링하는 데 사용됩니다.
하이퍼파라미터 최적화에 활용되며, 목표 함수의 불확실성을 고려하여 최적값을 찾습니다.
예를 들어, 인공지능 모델의 하이퍼파라미터 조정에 활용됩니다.
베이지안 프로세스 (Bayesian Process):
베이지안 프로세스는 베이지안 확률론에 기반한 순차적 최적화 전략을 사용합니다.
목표 함수의 불확실성을 추정하고, 이를 기반으로 하이퍼파라미터 최적값을 찾아냅니다.
정보보안 분야에서도 AISecurity와 관련하여 베이지안 기술이 적용 가능성을 가지고 있습니다.
이러한 기술들은 인공지능 붐에서 중요한 역할을 하고 있으며, 더 많은 연구와 응용이 기대됩니다.
가우시안 프로세스(Gaussian Process, GP)는 확률적인 모델링 방법으로, 데이터의 분포를 추론하는데 사용됩니다. 이론적으로는 오래전부터 존재했지만, 딥러닝이 활성화되면서 다양한 차이점이 나타났습니다.
딥러닝과 가우시안 프로세스의 차이점:
- 딥러닝은 신경망 구조를 사용하며, 많은 뉴런과 레이어로 복잡한 함수를 근사합니다.
- 가우시안 프로세스는 확률적인 함수를 직접 모델링하며, 평균 함수와 공분산 함수를 사용합니다.
- 딥러닝은 대량의 데이터를 필요로 합니다. 많은 샘플이 있을 때 성능이 향상됩니다.
- 가우시안 프로세스는 적은 데이터로도 유연하게 모델링할 수 있습니다.
- 가우시안 프로세스는 불확실성을 확률적으로 다루기 때문에 예측에 대한 불확실성을 제공합니다.
- 딥러닝은 불확실성을 직접 다루지 않고, 예측값만 제공합니다.
- 가우시안 프로세스에서 커널 함수는 데이터 간의 상관 관계를 정의합니다.
딥러닝에서는 커널 함수 대신 활성화 함수를 사용합니다
RNN은 시계열 데이터와 순차적인 데이터를 모델링하는데 사용됩니다.
가우시안 프로세스는 시간에 따른 불확실성을 다루는데 유용합니다.
따라서 RNN과 가우시안 프로세스는 서로 보완적인 역할을 합니다.
현재 딥러닝에서 non-parametric이라는 용어는 unsupervised 학습과 관련하여 사용됩니다. 이 개념은 라벨 없는 데이터를 활용하여 모델을 훈련하는 방식을 의미합니다. Non-parametric 방법은 파라미터의 수를 고정하지 않고 데이터에 따라 유연하게 모델을 구성하는 방식입니다. 이는 클러스터링 (예: K-means)이나 차원 축소 (예: PCA)와 같은 전통적인 비지도 학습 방법과도 관련이 있습니다.
시계열과 가우시안 프로세스는 다른 개념입니다. 시계열은 시간에 따라 변화하는 데이터를 다루는 것으로, 예측, 분류 또는 패턴 인식과 같은 작업에 사용됩니다. 반면 가우시안 프로세스는 확률적 모델로, 데이터의 분포를 모델링하고 예측하는 데 사용됩니다. 이 두 개념은 서로 다른 방식으로 코딩되며, 시계열 데이터를 다루는 경우 시계열 모델링 기법을 사용하고, 가우시안 프로세스를 적용할 때는 해당 프로세스를 구현하는 방식을 따릅니다.
뉴타닉스가 선도주자입니다만.. 타 H/W 벤더 HCI 제품과 다르게.. 엄밀히 따지만 다양한 H/W 제품군위에 솔루션을 제공한다는 장점이 반대로 H/W 와 솔루션 사이의 장애이슈에 대해서는 빠른 장애트러블슈팅이 가능할지에 대한 Risk 가 될 수 있다고 판단됩니다. 그에 일체형기반의 HCI 대비하여, 고객관점에서 빠른 장애처리이슈(ex H/W 버그 등) 에 대한 우려를 해소할수 있을런지요 ? HCI 도입을 위해 뉴타낙스 검토를 하는 Client 입장입니다.
Prism 을 통해 통합 관리가 가능하므로, 스토리지, 하이퍼바이저, 스토리지 컨트롤러, 하드웨어 등에 대한 성능과 이벤트 등을 한눈에 볼수 있어 기존의 3-Tier 방식보다는 보다 신속한 대응이 가능합니다
NUTANIX 도입 후 증설을 해야 하는 경우 Scale up 이 가능한가요? scale up 이 가능한 경우 scale up 과 Scale out 에 대한 비용차이는 얼마나 되나요?
Scale-Out은 노드 단위로 가능하며, Scale Up은 Disk, 메모리, NIC등이 가능합니다. 비용은 노드단위가 아무래도 좀더 비싸지 않을까요?
[질문] 현재 HCI 제품 도입검토를 진행 중인데 대부분의 서버벤더사들이 VMWare기반으로 제안을 하고 있습니다. 다른 벤더와 비교했을 때 뉴타닉스 제품의 장점이 뭐가 있을까요?
Nutanix는 '선택의 자유'를 제공한다는 점이 가장 큰 특장점이라고 할 수 있습니다. Vendor Lock-in이 없다는 것이죠. 하이퍼바이저도 Nutanix의 AHV (무료 라이선스)를 사용하실 수도 있지만, MS, VMware, Citrix의 하이퍼바이저를 사용하실 수도 있고 하드웨어도 마찬가지로 Nutanix 어플라이언스 제품을 사용하셔도 되지만, Dell, Lenovo, Cisco, HP, IBM 등등 어느 하드웨어에 올려서 사용하셔도 됩니다.
제품포트폴리오를 찾아보니 관리툴의 역할이 프리즘(VMWare의 vCenter?), 하이퍼바이저가 아크로폴리스(AHV), 하드웨어는 x86장비 대부분이 지원가능하다는 말이네요... 운영자 측면에서 문제는 Vendor Lock-in의 이슈보다 장애나 운영 시에 통합대응이 가능하냐의 문제가 나와서요... 각 제품군(관리툴,하이퍼바이저,하드웨어)을 따로따로 구성이 가능한 것은 좋지만 장애나 운영이슈에 멀티벤더가 가지는 한계(서로 책임을 떠넘긴다거나...)점을 가지게 될까바 우려가 되는데, 그 서비스측면에서 통합지원은 어떤 식으로 지원이 되는걸까요?
앞서 제가 질문한 의도가 위 내용과 유사해서 다시 문의를 드립니다. 답변주신 사항이.. "기존의 3-Tier 방식보다는 보다 신속한 대응이 가능합니다" 라고 주셨는데.. Client 입장에서는 위 송치승님이 의견주신대로 "장애나 운영이슈에 멀티벤더가 가지는 한계(서로 책임을 떠넘긴다거나...)" 부분에 대한 Risk에 대한 걱정을 방지하는게 우선일듯 합니다.
뉴타닉스가 HCI 시장에서 상당하게 heat 를 치고 있습니다. 현재 HCI 인프라로 전환될 때의 가장 큰 걱정 부분이 VM 에 대한 복제, 스토리지I/O 부분인데.. 이 부분에 대한 의견 을 부탁드립니다.
VM 복제 및 백업 기능은 기본적으로 제공하고 있습니다. 스토리지 IO의 경우, 기본적으로는 해당 vm이 있는 노드의 스코리지 컨트롤러를 통해 IO를 처리하나, 고성능 IO 처리가 팔요할 경우, 클러스터 전체의 스토리지 컨트롤러를 해당 VM에서 동시에 사용하게 하여 성능을 극대화하게 하는 기능을 제공합니다
[질문] OS와 Data 등 Hypervisor를 제외한 모든 데이터가 스토리지에 있기 때문에 스토리지 성능에 고민이 많습니다. 그리고 스토리지의 데이터 증가가 눈에 띄게 빠르기 때문에 이중화나 백업 방안이 시급한 현안 사항입니다. HCI 가 위 이슈를 어떻게 해결가능할지 간략하게나마 알고싶습니다.
뉴타닉스 HCI는 분산 스토리지 기능을 기본 제공합니다. Oracle RAC 같은 고성능을 요구하는 애플리케이션을 위해, 뉴타닉스는 클러스터 전체의 여러 스토리지 컨트롤러를 동시에 사용하여 성능을 극대화 하는 기능을 제공하고 있습니다. 떠힌, 기본적으로 데이터는 이중화를 제공하고, 추가로 백업 및 DR기능도 함께 제공합니다
[문의] 커스터마이징의 경중도에 따라 추가 비용이 발생 할 수도 있는 것이지요?
autodesk에서 개발을 해드리지는 않습니다. 개발 업체에 의뢰하셔서 커스터마이징 하셔야 합니다.
[질문] 알림은 이메일 외에 SNS 나 문자 등으로 가능한지요? 혹은 향후 로드맵에 있는지요?
사용하시는 메일에서 특정 메일을 받았을때, 문자로 보내주는 기능을 추가 하시면 되지 않을까요??
작성,발송한 내용의 취소기능도 필요하지않나요
이슈를 작성하고, 문제가 없으면, "해결" 로 상태를 변경 하시면 됩니다. 발송까지 취소되는지는 확인해 보겠습니다.
[문의]사용자 메뉴얼이 설명 자료들이 한글버젼이 지원되지 않는 경우가 있었던 경험이 있는데요. 소개해 주시는 내용들에 대한 교재나 메뉴얼 책자가 구매시 제공 되는지요?
네, 웹 화면은 한글을 지원하지 않으나, 사용하는 방법을 한글로 정리한 메뉴얼이 있습니다. "문의하기"에 글을 남겨 주시면, 담당자가 연락 드릴 것입니다.
본인이 문의하는 내용을 실시간으로 공유도 가능한가요. 기술미팅하는경우에..
채팅 기능은 추가 예정입니다. 하지만, 이슈를 작성하는 순간 웹에 업로드 됩니다.
채팅기능있다면 매우 편리하겠죠
네, 본사 BIM 360 개발 계획에 채팅 기능이 추가되어 있습니다. 곧 추가 될것으로 예상 하고 있습니다.
구성은 클라우드 타잎외에 하이브리드 타잎도 있는지요?
인터넷이 안될때를 대비하여 실시간 백업 등이 필요할 것 같아서요
인터넷이 안되는 현장에서 작성된 이슈는 사무실로 복귀한 뒤 인터넷에 접속이 되면 업로드가 됩니다.
[질문]Non parametric에 대해 공부중입니다. 처음 접하는 개념이라 질문사항이 몇가지가 있습니다.
1) 인공지능 붐이 일어나기 전과 후 non parametric에서 대세가 되고 있는 이론이 있나요?
2) 혹시 가우시안과 베이지안 프로세스가 현재 인공지능 붐의 대세인가요?
3) 가우시안 프로세스는 오래전에 나온 이론인데, 딥러닝이 활성화되면서 예전과 어떤 차이점이 있는지 궁금합니다.
RNN등으로 인해, 산출되는 값이 많이 바뀌기 시작한 것인가요?
추가로 질문하나만 더 드립니다. 기존에 non parametric이라고 칭하던게 현재 딥러닝에서 구사하는 unsupervised 개념이 맞는 것인지요? 또한 시계열과 가우시안 프로세스는 같은 방식의 코딩인가요?
성실한 답변 부탁드립니다.