안녕하십니까. 앤시스 코리아 양경모입니다.
1. 인공지능 붐이 일어나기 전과 후에도 여러 이론과 방법론이 발전하고 있습니다. Non-parametric 방법론은 그 중 하나입니다. 이 방법론은 데이터에 대한 가정 없이 모델을 구축하는 방식으로, 특히 데이터의 분포를 가정하지 않는 통계적 방법을 말합니다.
여기서 몇 가지 주목할만한 non-parametric 이론과 방법론을 소개해 드리겠습니다:
- K-최근접 이웃 (K-Nearest Neighbors, KNN)
- 커널 밀도 추정 (Kernel Density Estimation, KDE)
- 비모수적 가설 검정 (Non-parametric Hypothesis Testing)
- 부트스트레핑 (Bootstrap)
- 로우스톤 테스트 (Runs Test)
2. 현재 인공지능 분야에서 가우시안 프로세스와 베이지안 프로세스는 주목받고 있는 중요한 기술입니다.
가우시안 프로세스 (Gaussian Process):
가우시안 프로세스는 확률론적 모델링 방법으로, 불확실성을 추정하고 함수를 모델링하는 데 사용됩니다.
하이퍼파라미터 최적화에 활용되며, 목표 함수의 불확실성을 고려하여 최적값을 찾습니다.
예를 들어, 인공지능 모델의 하이퍼파라미터 조정에 활용됩니다.
베이지안 프로세스 (Bayesian Process):
베이지안 프로세스는 베이지안 확률론에 기반한 순차적 최적화 전략을 사용합니다.
목표 함수의 불확실성을 추정하고, 이를 기반으로 하이퍼파라미터 최적값을 찾아냅니다.
정보보안 분야에서도 AISecurity와 관련하여 베이지안 기술이 적용 가능성을 가지고 있습니다.
이러한 기술들은 인공지능 붐에서 중요한 역할을 하고 있으며, 더 많은 연구와 응용이 기대됩니다.
가우시안 프로세스(Gaussian Process, GP)는 확률적인 모델링 방법으로, 데이터의 분포를 추론하는데 사용됩니다. 이론적으로는 오래전부터 존재했지만, 딥러닝이 활성화되면서 다양한 차이점이 나타났습니다.
딥러닝과 가우시안 프로세스의 차이점:
- 딥러닝은 신경망 구조를 사용하며, 많은 뉴런과 레이어로 복잡한 함수를 근사합니다.
- 가우시안 프로세스는 확률적인 함수를 직접 모델링하며, 평균 함수와 공분산 함수를 사용합니다.
- 딥러닝은 대량의 데이터를 필요로 합니다. 많은 샘플이 있을 때 성능이 향상됩니다.
- 가우시안 프로세스는 적은 데이터로도 유연하게 모델링할 수 있습니다.
- 가우시안 프로세스는 불확실성을 확률적으로 다루기 때문에 예측에 대한 불확실성을 제공합니다.
- 딥러닝은 불확실성을 직접 다루지 않고, 예측값만 제공합니다.
- 가우시안 프로세스에서 커널 함수는 데이터 간의 상관 관계를 정의합니다.
딥러닝에서는 커널 함수 대신 활성화 함수를 사용합니다
RNN은 시계열 데이터와 순차적인 데이터를 모델링하는데 사용됩니다.
가우시안 프로세스는 시간에 따른 불확실성을 다루는데 유용합니다.
따라서 RNN과 가우시안 프로세스는 서로 보완적인 역할을 합니다.
현재 딥러닝에서 non-parametric이라는 용어는 unsupervised 학습과 관련하여 사용됩니다. 이 개념은 라벨 없는 데이터를 활용하여 모델을 훈련하는 방식을 의미합니다. Non-parametric 방법은 파라미터의 수를 고정하지 않고 데이터에 따라 유연하게 모델을 구성하는 방식입니다. 이는 클러스터링 (예: K-means)이나 차원 축소 (예: PCA)와 같은 전통적인 비지도 학습 방법과도 관련이 있습니다.
시계열과 가우시안 프로세스는 다른 개념입니다. 시계열은 시간에 따라 변화하는 데이터를 다루는 것으로, 예측, 분류 또는 패턴 인식과 같은 작업에 사용됩니다. 반면 가우시안 프로세스는 확률적 모델로, 데이터의 분포를 모델링하고 예측하는 데 사용됩니다. 이 두 개념은 서로 다른 방식으로 코딩되며, 시계열 데이터를 다루는 경우 시계열 모델링 기법을 사용하고, 가우시안 프로세스를 적용할 때는 해당 프로세스를 구현하는 방식을 따릅니다.
세대를 나눈다는 것은 큰 변화가 있다는 의미일텐데, 1세대와 2세대 클라우드의 가장 큰 차이점은 무엇인가요?
제가 알고 있는 Oracle Cloud Gen1 vs Gen2의 차이점입니다. 참고하세요.
the difference of Oracle Cloud Gen1 vs Gen2
Generation 1 clouds place user code and data on the same computers as the cloud control code with shared CPU, memory, and storage.
That means cloud providers can see customer data, and it enables customer code to access cloud control code, which can lead to breaches and cyberattacks.
Oracle's Generation 2 Cloud puts customer code, data, and resources on a bare metal computer, while cloud c
1세대와 2세대의 가장 큰 차이점은 아키텍처의 변화에 있습니다. 2세대에서는 네트워크 컨트롤 플레인을 하이퍼바이저에서 제외하여 보안 및 성능 향상의 이점이 있습니다.
제 Notebook에 Discovery Live를 설치했는데 Graphic Card 문제가 생기는데 이를 해결할 수 있는 방법이 있나요?
Discovery LIVE는 실시간시뮬레이션을 위해 GPU를 사용합니다.
Nividia의 그래픽카드 중 메모리가 4G 이상이면 사용이 가능합니다.
디스커버리 포럼에 가입하셨다면 아래 링크에서 지원그래픽 모델을 확인하실 수 있습니다.
https://discoveryforum.ansys.com/t/x150rr/list-of-known-discovery-live-friendly-gpus-or-graphics-cards
현재 해당 그래픽카드를 보유하고 있지 않으시다면 Cloud상에서 체험하실 수 있습니다. 디스커버리 포럼에 가입하신 후 아래 링크를 이용하시면 됩니다.
https://discoveryforum.ansys.com/t/181pa8
자율주행 자동차에 유체분석이 필수 인 것 같네요. 근접시 속도에 따른 날씨에 따라서도 공기, 물(비) 해석이 필요할 것 같은데요. 비오는 환경을 고려한 유체 분석도 가능한지요?
맞습니다. 네비게이션을 켜고 타지를 운행할때 실제 50~90m 정도의 DELAY가 발행되는 것 같습니다. 시간으로 따지면 30초 이상인데요 이정도의 오차로 자율주행한다면 돌발시 대응이 불가능할 것 같습니다. 이 부분이 해결될까요?
어떤 관점에서 보느냐에 따라 ANSYS 해석으로 가능합니다. 자세한 내용은 마지막 Q&A 시간 또는 세미나 이후에 다시 답변드리도록 하겠습니다.
[질문] 저장 버젼의 통합 계획을 가져 주시는게 좋을것 같습니다. 업무상 캐드를 사용함에 2014부터 2019까지 다양하게 파일이 유통되는데 버젼을 가리지 않게 해주실수없나요 ? 버젼을 컨버트 해주는 툴을 배포하던지 해야 할거 같아요., 라이선스 이슈/ 유통되는 버젼이 맞지 않을때는 하위버젼으로 주세요. 등등 여러 불편함이 많습니다.
번거로우시죠? ^^ 일반적인 소프트웨어는 대부분 상위버전의 파일은 하위버전에서 열리지 않는 경우가 많습니다. 상위버전에서 하위버전으로 컨버팅하는 것은 가능하기 때문에 옵션에서 한번만 저장 버전을 바꿔주시면 이후 작업에서는 하위버전으로 계속 저장됩니다 ^^
[질문] 통합 버젼 파일이 하위 버젼에서 오픈 안되는 문제가 있는데, 2020에서는 어떻게 되는지요 ?
2020버젼으로 저장후 2019에서 파일 열기시 그냥 오픈 되는 건지 아니면 2019 하위버젼으로 저장하여 오픈 해야 하는 지?
버전에 대한 내용은 AutoCAD와 동일하며, 2020버전의 파일은 하위버전에서 열리지 않기 때문에 2020버전에서 하위버전으로 저장하셔서 송부해주셔야 합니다^^
옵션(op)명령에서 저장되는 버전을 하위버전으로 설정하여 사용하실 수 있습니다. https://knowledge.autodesk.com/ko/support/autocad/learn-explore/caas/sfdcarticles/sfdcarticles/KOR/Changing-the-default-file-save-format-in-AutoCAD.html
[질문]Non parametric에 대해 공부중입니다. 처음 접하는 개념이라 질문사항이 몇가지가 있습니다.
1) 인공지능 붐이 일어나기 전과 후 non parametric에서 대세가 되고 있는 이론이 있나요?
2) 혹시 가우시안과 베이지안 프로세스가 현재 인공지능 붐의 대세인가요?
3) 가우시안 프로세스는 오래전에 나온 이론인데, 딥러닝이 활성화되면서 예전과 어떤 차이점이 있는지 궁금합니다.
RNN등으로 인해, 산출되는 값이 많이 바뀌기 시작한 것인가요?
추가로 질문하나만 더 드립니다. 기존에 non parametric이라고 칭하던게 현재 딥러닝에서 구사하는 unsupervised 개념이 맞는 것인지요? 또한 시계열과 가우시안 프로세스는 같은 방식의 코딩인가요?
성실한 답변 부탁드립니다.