• avatar
    2020-06-26 Paseul

    [질문] autoML을 사용하는 경우 XAI에 관련된 문제제기가 되었을 때 설명할 수 있는 자료가 같이 제공될 수 있나요?

  • avatar
    2020-06-26 베이맥스

    아니요. XAI는 별도의 영역입니다. autoML 사용 시, deep learning 기반의 alogrithm들이 사용되게 되는데 아시다시피 DNN 이 사용된 알고리즘에서는 XAI와 관련된 이슈가 있습니다.


  • avatar
    2020-06-26 네스라인

    [질문]보통 가성비라고 표현하는데 데이터도 가성비 좋은 양 혹은 비용
    이 있을까요?

  • avatar
    2020-06-26 베이맥스

    ML에서는 데이터의 가성비를 생각하기보다, 질 좋은 데이터를 최대한 많이 input으로 넣어주는 것이 효율적이고 효과적입니다.



  • avatar
    2020-06-26 이종우

    [질문] 동일 데이터로 여러가지 알고리즘을 적용해서 리포트를 받을 수 있나요?

  • avatar
    2020-06-26 베이맥스

    네 물론입니다. Solution을 각 알고리즘별로 만드셔서 비교하는 방법이 있고, AutoML 기능을 활용하시면 알고리즘별로 결과를 보실 수 있습니다.


  • avatar
    2020-06-26 김태식

    [질문] 레시피?(요리법) 가 머신러닝의 알고리즘이라고 하셨는데요, 오토ML기능을 자동차와 비유해서 설명해 주셨는데요, 오토ML과 메뉴얼의 실행 결과치가 다른것 같은데요, 오토ML과 메뉴얼은 각각의 사용 목적이 다른것 인지요?

  • avatar
    2020-06-26 베이맥스

    쉽게 말씀드리면 Auto ML 기능을 쓰시는 경우는 레서피(알고리즘)에 대해 잘 모르겠다 싶을 때 사용하시면 되구요. 메뉴얼은 각 레서피(알고리즘) 및 input data의 특성 등에 대한 이해도가 어느정도 있을 경우에 사용을 추천드립니다.


  • avatar
    2020-06-26 박선희

    [질문] 쇼핑몰추천을 만드는 경우 기존 데이타가 없을때 일반적인 추천 모델을 사용하고, 점차적으로 데이타가 쌓임에 따라 모델을 업데이트할 수도 있는 것인가요?

  • avatar
    2020-06-26 베이맥스

    기존 데이터가 전혀 없으면 사용이 어렵습니다. 뒤쪽에 말씀하신 데이터 쌓임에 따라 모델 업데이트는 가능합니다.


  • avatar
    2020-06-26 Lisayg

    버킷이 쿠버네티스의 pod 와 같은 개념인지요?

  • avatar
    2020-06-26 베이맥스

    아니요. 컨테이너와는 관계가 없습니다. S3라는 클라우드 상의 object storage에서 디렉터리/폴더 개념으로 존재하는 것이라고 생각하시면 됩니다.


  • avatar
    2020-06-26 김태식

    [질문] 버킷파일을 만들때 버킷파일의 파일 이름에 유니크한 제한이 있다고 하셨는데요, 그럼 그 의미는 버킷파일 네임을 다른 시스템들에서 접속해서 같이 사용한다다는 의미인지요?

  • avatar
    2020-06-26 베이맥스

    다른 시스템들에서 접속해서 같이 사용한다는게 무슨 의미인지 잘 모르겠습니다. 다만 버킷이름이 유니크해야하는 이유는, S3의 내부 구조와 연관이 있다고 이해해주시면 될 것 같습니다.


  • avatar
    2020-06-26 김태식

    [질문] 방송에서 웨이팅은 나중에 메타데이터로 했을때 정확도가 올라간다고 하셨는데요? 무슨 뜻인지 좀더 쉽게 설명 부탁 드립니다.

  • avatar
    2020-06-26 베이맥스

    Interaction dataset 외에 input dataset으로 활용 가능한 dataset이 두 개 더 있습니다. User/Item metadata에 대한 것인데요. 이렇게 추가로 dataset를 활용하게 되면 정확도가 올라갈 확률이 더 높아집니다.


  • avatar
    2020-06-26 김태식

    [질문] 등급파일인 rating.csv 파일이 하는 역활은 어떤 역활인지요? 혹시 사용자 보안에도 관여 하는지요?

  • avatar
    2020-06-26 베이맥스

    보안과는 관련이 없습니다. rating.csv 파일은 현재 화면에 엑셀로 열려있는 화면을 보시면, Personalize 에 input data로 들어갈 interaction dataset의 raw data라고 보시면 됩니다.


  • avatar
    2020-06-19 이종필

    [질문] 기존 데이터가 oracle이나 MSSQL등의 DB형태로 되어있는지는 크게 중요하지 않은가요? 별도의 컨저전 과정이 필요한가요?

  • avatar
    2020-06-19 AWS Korea

    오늘 소개해드리는 Forercast와 AWS Sagemaker라는 머신러닝 플랫폼은 S3를 기반으로 작업합니다.
    하지만 DB를 데이터 소스로 해서 Sagemaker에서 활용할 수 있는 다양한 방법들을 이미 소개해서 고객분들이 적용하고 있습니다.
    https://aws.amazon.com/ko/blogs/machine-learning/run-sql-queries-from-your-sagemaker-notebooks-using-amazon-athena/


  • avatar
    2020-06-19 ho

    [질문]AI를 활용한 분석을 하기 전에 데이터 수집과 사전 정제 작업에 대한 중요도와 원하는 결과 값 도출을 위해 어떤 전문성을 가져야 하는지 궁금합니다.

  • avatar
    2020-06-19 AWS Korea

    많은 데이터와 데이터의 정제 작업은 모델 성능에 반드시 영향을 줍니다.
    따라서 (1) 데이터를 모으는 것 (2) 데이터를 정제하는 것을 위해서 자해당 도메인의 데이터를 잘 아시는 것이 무엇보다 중요합니다.
    예를 들면 이 데이터가 Null인지 0인지에 따라서도 달라지기 때문에 수집한 데이터가 잘 모아졌는지, 왜곡되었는지를 모델 학습 전에 판단할 수 있어야 합니다.


  • avatar
    2020-06-19 DBIT

    [질문] 예측 파이프라인 갱신 주기(모델 업데이트)는 대체로 어느 정도인가요?

  • avatar
    2020-06-19 AWS Korea

    모델 업데이트 주기는 기업이 가진 데이터의 갱신주기에 따라서 결정되며, 모두 고객의 의지에 의해서 진행됩니다.


  • avatar
    2020-06-19 DBIT

    [질문] 기존의 데이터에서 통계적으로 패턴을 찾아서 향후의 통찰력을 뽑아내거나 연관성을 찾는 것으로 압니다. 신뢰성 확보 위해 어느 수준의 정량적인 기존 데이터가 필요할
    까요?

  • avatar
    2020-06-19 AWS Korea

    물론입니다!! 머신러닝 기반의 시계열 분석은 무조건 데이터가 많아야 합니다. 통계적 패턴이 무시되는게 아니라, 이 또한 포함되어 모델이 만들어집니다.


  • avatar
    2020-06-19 방극민

    (질문) 과거 데이터가 있다면 어느 분야에도 상관없이 예측정보를 얻을수 있는건가요?

  • avatar
    2020-06-19 AWS Korea

    그 분야의 과거데이터를 바탕으로, 그 분야의 현재와 가까운 미래를 예측하는 방법입니다. 따라서 데이터가 분석하고자 하는 분야와 연관이 있어야 합니다.


  • avatar
    2020-06-19 Paseul

    [질문] 기존에 수학적 예측모델과 머신러닝을 활용한 예측모델의 신뢰도를 비교한다면 어떤 차이가 있을까요?

  • avatar
    2020-06-19 AWS Korea

    머신러닝에서 사용하는 예측 모델은 고객의 데이터를 기반으로 제공되며, 이 때 예측모델의 학습과정에서 사용되는 알고리즘은 수학적인 모델을 기반합니다.
    https://docs.aws.amazon.com/ko_kr/forecast/latest/dg/aws-forecast-choosing-recipes.html

    ARIMA같은 경우는 전통적인 기법의 구조적인 데이터를 분석하는 알고리즘입니다.


  • avatar
    2020-06-19 이세원

    [질문] 인공지능의 알고리즘이 어쩜 제일 중요할텐데 오류가 생길 가능성은 없는지 궁금하네요

  • avatar
    2020-06-19 AWS Korea

    당연하게 데이터에 따라서 알고리즘이 맞지 않은 경우가 많이 있습니다. 따라서 데이터를 기반으로 만든 모델의 성능을 확인하고, 이를 개선화는 과정에서 알고리즘을 변경하는 경우도 많습니다.


  • avatar
    2020-06-19 FBI

    [질문] 예측의 정확성을 위해 수치화를 하는 것이 필요한가요

  • avatar
    2020-06-19 AWS Korea

    네 모든 학습과정은 수치화됩니다.
    내가 학습한 모델의 정확성을 위한 매트릭은 아래와 같습니다.
    https://docs.aws.amazon.com/ko_kr/forecast/latest/dg/metrics.html


  • avatar
    2020-06-19 임호빈

    [질문][질문]클라우드 머신러닝을 사용할 수 있는 비용 관리에 대해 알고 싶은데 어디서 참조 할 수 있을까요?

  • avatar
    2020-06-19 AWS Korea

    여러 세션을 통해서 해당 비용관리에 대해서 소개된 적이 있습니다.
    Youtube의 AWS채널을 통해서 확인하실수 있습니다.

    최근 소개된 내용은 아래와 같습니다. https://www.youtube.com/watch?v=Ltw5EixHDNc&pbjreload=101


  • avatar
    2020-06-19 프롱

    비즈니스모델마다 적합한 예측 모델과 변수가 다를텐데요. sagemaker 에서는 유형별로 선택가능한 모델을 선택하게끔 되있습니다만, 실제로 적용 이후 정확도를 상승시키는 작업도 어느정도 자동화 되는지요?

  • avatar
    2020-06-19 AWS Korea

    정확도를 상승시키기 위해서는 새로 유입되는 데이터를 기반으로 지속적으로 학습하여 초기 모델의 성능을 높이는 방법으로 접근하셔야 합니다. 이를 위한 자동화를 위한 방법은 SageMaker를 통해서 제공됩니다.