• avatar
    2020-07-03 김태식

    [질문] 세이지메이커의 작동 원리에서, 사용자가 AWS 알고리즘을 선택할 수 있으며, 텐서플로우 같은 유명 프레임워크에서 불러올 수도 있는데요, 텐서플로우 프레임워크가 하는 역활은 무엇인지요?

  • avatar
    2020-07-03 조창윤

    SageMaker 는 당양한 Framework 을 지원하고 있습니다. 말씀하신 Tensorflow 는 물론 PyTouch, MXNet 은 물론 Scikit-learn 을 지원합니다.
    이미 원하시는 Framework 이 설치되어 있다고 생각하시면 됩니다.


  • avatar
    2020-07-03 박선희

    [질문] 이런 네이블링 등의 목적으로 머신러닝을 수행할 때 필요한 영상이미지가 충분히 있어야 할텐데, 좋은 영상들을 충분히 얻을 수 있는 좋은 방법이 있을까요?

  • avatar
    2020-07-03 bonayaing81

    1) 기본적으로 많이 공개된 데이터들을 활용하시고요, 2) 1번 데이터 set에다 업게 specific한 데이터를 추가해서 같이 합니다.


  • avatar
    2020-07-03 automan

    [질문] 아마존 SageMaker로 학교 교육프로그램으로 활용하는 사레가 있나요?

  • avatar
    2020-07-03 조창윤

    알려진 사례는 많지 않습니다. 과거에 GPU 서버를 직접 사셔서 진행하신 경우가 많았고, 최근에 AWS SageMaker 에 대한 문의가 많아지고 있는것은 사실입니다. Cloud 장점에 Machine Learning 을 쉽게하기 위한 방법을 많이 찾으시기 때문입니다.

  • avatar
    2020-07-03 automan

    답변 감사합니다.
    향후 교육 연게된 모델링 시에 연락드리겠습니다.


  • avatar
    2020-07-03 박미유

    [질문]지금 설명하고 계시는 레이블링 작업에서 어떤 특정 회사나 특정 집단에서만 작업을 하면 레이블링 기준(?)이 동일할 것 같지만 만약 다른 회사나 집단에서도 작업한 것들, 즉 이종 집단에서 레이블링 한 데이터들을 하나로 묶으려 할 때 문제가 생길 것도 같은데(가령 데이터처리시의 샘플링 문제 등) 그건 어떻게 처리를 하나요?

  • avatar
    2020-07-03 bonayaing81

    여려 명에게 배포하는 방식과 과거 labeling하시던 분의 정확도에 따라 해당분의 label에 좀더 weight를 줘서 confidence를 계산하는방법들이 있습니다.


  • avatar
    2020-07-03 김태식

    [질문] 세이지메이커는 기업용 앱을 위한 머신러닝 알고리즘을 개발, 학습, 적용하는 플랫폼으로 인프라 프로비저닝과 관리, 학습 모델 튜닝 등 그동안 머신러닝 개발 시 일반적으로 필요했던 수작업을 상당 부분 없애 주는것으로 알고 있는데요, 일반적인 머신런닝 처리방식에 비해서 AWS 세이지메이커만의 특화된 장점이 있는지요?

  • avatar
    2020-07-03 조창윤

    말씀하신것 처럼 결론은 개발/학습/배포 입니다. AWS SageMaker 을 이용해서 쉽고/빠르게/싸게 진행할 수 있는 것이 특장점이며 이를 위해서 SageMaker 의 정말 많은 기능들이 존재합니다. Autopilot, Processing, Debugger, Monitor, Tuning, Inference flow 등등등. 또한 당연히 AWS Cloud 의 여러 서비스들과 Integration 되어서 진행되기 때문에 SageMaker 의 장점 + AWS Cloud 의 장점이 도움을 줍니다.

  • avatar
    2020-07-03 박우일

    많은 도움이 되는 질문 답변입니다 . 감사합니다.


  • avatar
    2020-07-03 김태식

    [질문] 제가 알기로는 아마존 웹 서비스에서 머신러닝 플랫폼 '세이지메이커를 2017년 12월에 공개를 했는데요, 이를 이용하면 AWS 서비스 사용자가 인공지능(AI) 알고리즘을 더 쉽게 활용할 수 있는데요, 세이지메이커 공개이후 지금까지 업데이트가 어느 수준까지 되었는지 궁금 합니다.

  • avatar
    2020-07-03 bonayaing81

    작년 2019 reinvent(Dec) 에서만 새로 나온 서비스가 및 기능들이 대략적으로 나열해도 debugger, model monitor, A2I studio spot적용, kubflow/airflow operator, TF2 제공, processing, experiment등이 나왔습니다.


  • avatar
    2020-07-03 이종우

    [질문] Amazon SageMaker Studio 도 azure AI studio 처럼 동일한 데이터에 대해서 인공지능 룰들을 다르게 적용해서 결과값을 비교해 볼 수 있나요?

  • avatar
    2020-07-03 조창윤

    당연히 동일한 알고리즘과 동일한 데이터셋이 있으시다면 비교 가능하십니다. 하지만 동일한 알고리즘을 사용했더라도 Hyper-parameter 튜닝 정도에 따라서 결과의 차이는 있습니다. 그렇기 때문에 AWS 또는 Azure 어느쪽에서 더 결과가 좋다는 방향보다 얼마나 편하게, 쉽게, 싸게 좋은 결과를 얻느냐에 집중해주시는 것이 좋을것으로 판단됩니다.


  • avatar
    2020-07-03 골든아이

    확률과 통계의 기본 개념과 식을 이해하고 기본문제 정도를 풀 수 있는 정도의 수학적 지능만 갖춰도 프로그래밍 개발이 가능할까요?

  • avatar
    2020-07-03 조창윤

    프로그래밍은 전문적으로 배우셔야 한다고 판단됩니다. 확률이나 통계 개념이 있으시면 비전공자보다는 빠를수 있습니다.
    간단한 프로그램은 개발할 수 있느나 Deep 한것들은 쉽지 가 않기 때문입니다.


  • avatar
    2020-07-03 차지용

    [질문] 데이터 처리과정 중에 정형데이터 비정형데이터 처리 방식의 런닝 훈련 차이는 무엇인가요?

  • avatar
    2020-07-03 bonayaing81

    어찌됐든 다 수치로 바꿔야 하고요 이미지는 RGB로 정의로 하고요 언어는 word단위로 보통 수치화 합니다.

  • avatar
    2020-07-03 차지용

    답변감사합니다. 혹 AWS에서 사용하는 방법이신건가요? 아님 타사에서도 보편적으로 사용하는 방법인가요?


  • avatar
    2020-06-26 정용배

    [질문] 머신러닝 또는 빅데이터 환경 구축을 위해서는 학습데이터를 준비하는데 많은 비용과 시간이 필요하며 레이블링이 불가능한 AI문제들이 증가하는 리스크가 존재합니다. 이에 대한 대안에 대해 문의드립니다.

  • avatar
    2020-06-26 베이맥스

    https://aws.amazon.com/ko/sagemaker/groundtruth/

    참고 부탁드립니다.


  • avatar
    2020-06-26 CoolGuy

    [질문] 입력 데이터 형식을 지정할 때 CSV 파일 열 헤더 표시 방식은 " " 안에 넣으면 되는 것인지요? 설명 부탁드립니다.

  • avatar
    2020-06-26 베이맥스

    https://docs.aws.amazon.com/ko_kr/personalize/latest/dg/how-it-works-dataset-schema.html

    참고 부탁드립니다.


  • avatar
    2020-06-26 Paseul

    [질문] autoML을 사용하는 경우 XAI에 관련된 문제제기가 되었을 때 설명할 수 있는 자료가 같이 제공될 수 있나요?

  • avatar
    2020-06-26 베이맥스

    아니요. XAI는 별도의 영역입니다. autoML 사용 시, deep learning 기반의 alogrithm들이 사용되게 되는데 아시다시피 DNN 이 사용된 알고리즘에서는 XAI와 관련된 이슈가 있습니다.


  • avatar
    2020-06-26 네스라인

    [질문]보통 가성비라고 표현하는데 데이터도 가성비 좋은 양 혹은 비용
    이 있을까요?

  • avatar
    2020-06-26 베이맥스

    ML에서는 데이터의 가성비를 생각하기보다, 질 좋은 데이터를 최대한 많이 input으로 넣어주는 것이 효율적이고 효과적입니다.



  • avatar
    2020-06-26 이종우

    [질문] 동일 데이터로 여러가지 알고리즘을 적용해서 리포트를 받을 수 있나요?

  • avatar
    2020-06-26 베이맥스

    네 물론입니다. Solution을 각 알고리즘별로 만드셔서 비교하는 방법이 있고, AutoML 기능을 활용하시면 알고리즘별로 결과를 보실 수 있습니다.


  • avatar
    2020-06-26 김태식

    [질문] 레시피?(요리법) 가 머신러닝의 알고리즘이라고 하셨는데요, 오토ML기능을 자동차와 비유해서 설명해 주셨는데요, 오토ML과 메뉴얼의 실행 결과치가 다른것 같은데요, 오토ML과 메뉴얼은 각각의 사용 목적이 다른것 인지요?

  • avatar
    2020-06-26 베이맥스

    쉽게 말씀드리면 Auto ML 기능을 쓰시는 경우는 레서피(알고리즘)에 대해 잘 모르겠다 싶을 때 사용하시면 되구요. 메뉴얼은 각 레서피(알고리즘) 및 input data의 특성 등에 대한 이해도가 어느정도 있을 경우에 사용을 추천드립니다.


  • avatar
    2020-06-26 박선희

    [질문] 쇼핑몰추천을 만드는 경우 기존 데이타가 없을때 일반적인 추천 모델을 사용하고, 점차적으로 데이타가 쌓임에 따라 모델을 업데이트할 수도 있는 것인가요?

  • avatar
    2020-06-26 베이맥스

    기존 데이터가 전혀 없으면 사용이 어렵습니다. 뒤쪽에 말씀하신 데이터 쌓임에 따라 모델 업데이트는 가능합니다.


  • avatar
    2020-06-26 Lisayg

    버킷이 쿠버네티스의 pod 와 같은 개념인지요?

  • avatar
    2020-06-26 베이맥스

    아니요. 컨테이너와는 관계가 없습니다. S3라는 클라우드 상의 object storage에서 디렉터리/폴더 개념으로 존재하는 것이라고 생각하시면 됩니다.


  • avatar
    2020-06-26 김태식

    [질문] 버킷파일을 만들때 버킷파일의 파일 이름에 유니크한 제한이 있다고 하셨는데요, 그럼 그 의미는 버킷파일 네임을 다른 시스템들에서 접속해서 같이 사용한다다는 의미인지요?

  • avatar
    2020-06-26 베이맥스

    다른 시스템들에서 접속해서 같이 사용한다는게 무슨 의미인지 잘 모르겠습니다. 다만 버킷이름이 유니크해야하는 이유는, S3의 내부 구조와 연관이 있다고 이해해주시면 될 것 같습니다.


  • avatar
    2020-06-26 김태식

    [질문] 방송에서 웨이팅은 나중에 메타데이터로 했을때 정확도가 올라간다고 하셨는데요? 무슨 뜻인지 좀더 쉽게 설명 부탁 드립니다.

  • avatar
    2020-06-26 베이맥스

    Interaction dataset 외에 input dataset으로 활용 가능한 dataset이 두 개 더 있습니다. User/Item metadata에 대한 것인데요. 이렇게 추가로 dataset를 활용하게 되면 정확도가 올라갈 확률이 더 높아집니다.