• avatar
    2020-07-03 LJW

    [질문]Amazon SageMaker Studio 의 우수 성공사례가 있나요?

  • avatar
    2020-07-03 bonayaing81

    Sagemaker Studio는 최근 오픈한 서비스 여서 제가 많은 사례를 다 알지는 못하지만 https://aws.amazon.com/sagemaker/customers/ 에 가시면 좀 도움이 되실거 같습니다.


  • avatar
    2020-07-03 ho

    [질문]아마존 서지메이커 워크플로는 정해진 포맷을 지원하는지요?확장된 워크플로는 부분 변경이 가능한지 문의합니다.

  • avatar
    2020-07-03 조창윤

    SageMaker 의 각 Job 들 (Processing Job, Training Job, Hosting Job 등) 에 대한 Workflow 말씀하시는 거라면 AWS Stepfunction 이나 Apach Airflow 또는 Kuberflow 을 사용하실수도 있습니다.


  • avatar
    2020-07-03 박선희

    [질문] s3가 아닌 다른 원격지에 있는 데이타를 이용하는 것도 가능한가요? 3s와 마찬가지로 데이타다운로드에 대한 과금이 안되나요?

  • avatar
    2020-07-03 bonayaing81

    일단은 S3로 무조건 이전해 와있어야합니다. Data transfer out비용은 발생합니다. 하지만 sagemaker와 S3사이의 데이터 transfer는 비용이 발생하지 않습니다.


  • avatar
    2020-07-03 이세원

    [질문] 알고리즘의 성능이 인공지능의 질적 차이를 가져올것 같은데 이에 대한 차별화된 특징이 있는지요?

  • avatar
    2020-07-03 bonayaing81

    지금 보시는 18가지 알고리즘은 이미 업계에서 표준화된 알고리즘입니다. 딥러닝이 아닌 것과 딥러닝이 아닌것이 합쳐져 있습니다.
    일반적인 워크로드에 최적화 됬다고 보시는게 맞습니다.


  • avatar
    2020-07-03 김태식

    [질문] 기존까지 모델 튜닝은 시행착오 방식으로 진행이 되었고. 해보고 안되면 다른 대안을 찾는 식이었는데요. 그러나 세이지메이커는 이른바 HPO 방식을 사용하여 간단한 클릭만으로 훈련 모델의 여러 복사본이 만들어지고, 머신러닝을 이용해 각 변화를 동시에 검토하여, 이 검토 결과에 따라 변수를 튜닝을 하는데요, HPO 방식에 관한 설명을 요청 드립니다.

  • avatar
    2020-07-03 조창윤

    말씀하시는 바와 같이 ML 은 '데이터셋' 부터 '배포/서비스/모니터링' 까지 엄청남 노력과 반복작업입니다. Feature Engineering 을 하게 되면 다시 HPO 진행하셔야 한다는점 미리 말씀드립니다.
    엄청나게 Engineering 을 진행한 데이터셋이 있다고 가정하였을때 제가 사용하려는 알고리즘 (예, xgboost) 을 선택하면 알고리즘의 static parameter 를 고정하시고 tuning 할 parameter 을 정의하시면 됩니다. Tuning 하려는 parameter 별로 range 을 주시면 HPO 후에 해당 range 에서 어떤 값이 가장 Best 다라고 결과가 나옵니다.
    추가로 한번 HPO 후 완료하는 것이 아니라 range 을 처음에는 조금 크게, 그 다음은 조금 작게...이런식으로 몇번을 하시는것을 추천드립니다.


  • avatar
    2020-07-03 전영진

    [질문] 주요 알고리즘은 DLAMI으로 직접 python 코드로 구성하면서 SageMaker Ground Truth의 레이블링을 병용하는 것이 가능한지 그리고 혹시 병용할 수 있는 다른 더 좋은 레이블링 방법이 있는지 궁금합니다.

  • avatar
    2020-07-03 bonayaing81

    DLAMI는 학습을 위한 전용 framework들이 설치된 OS+framework+packes 인 이미지 이고요, 여기 위에서 학습을 위해 필요한 데이터를 준비하시는 과정에서 GroundTruth(GT)를 사용하실수 있습니다. GT에서 나온 결과를 가지고 sagemaker에서든 DLAMI든 학습하시는거는 원하시는 사양에 맞춰 하시면 됩니다.


  • avatar
    2020-07-03 김태식

    [질문] 세이지메이커 알고리즘을 훈련하려면 S3 내의 특정 부분과 사용할 인스턴스를 선택하기만 하면 되고, 클릭 한 번으로 별도의 클러스터와 소프트웨어 정의 네트워크가 만들어지고, 이 클러스터는 실제 훈련을 시작하기 위한 확장성과 데이터 파이프라인을 지원해서. 훈련이 끝나면 클러스터를 삭제하면 된다라고 알고 있는데요, 누구나 이런 훈련과정을 배우는데 있어서 어려움은 없는지요?

  • avatar
    2020-07-03 조창윤

    솔찍히 쉽지많은 않습니다. 말씀하신 모든 과정들을 쉽게/빠르게/싸게 진행할 수 있도록 다양한 기능들을 제공하는데 그런 기능들을 익히고 사용하는데 바로 되지는 않습니다. 다만 그런 기능들을 직접 구현하시거나 몸빵으로 진행하신다면 수배/수십배의 시간/돈이 발생한다고 생각됩니다.


  • avatar
    2020-07-03 김성환

    제조업에서의 머신러닝 적용 구체적인 사례가 궁금합니다.

  • avatar
    2020-07-03 조창윤

    국내 제조쪽 대기업에서는 내부적으로 엄청많은 ML/DL 을 적용중에 있습니다. 물론 제조쪽 대기업에는 Data Scientist 팀이 있으며 가장 일반적인 사례는 수요예측 (Demand Forecasting, 단기/장기 예측), 이상징후 탐지 (장비 센서 데이터를 이용한 불량 판별) 등이 많고 몇몇 고객분들은 RL 도 진행하시는 곳이 있습니다.


  • avatar
    2020-07-03 나미스테원주

    최근 라베러가새로운 job으로 핫합니다
    우리나라에서도 비지니스모델로 어떻게 보고 계시는지요

    그리고
    현재주요 라벨링하는 곳에서 어떤 데이타 분야에 활성화 돼 있는지요

    특히 의료 영상 데이터 라벨링 시행착오 유의점에 대해 부태드립니다

  • avatar
    2020-07-03 bonayaing81

    이미지 3D Lidar 데이터 등이 많이 핫한 곳이고요,
    시행착오방지를 위해 여러 사람이 labeling하게 하고 voting이나 confidence를 추적하는 방식이 있습니다.


  • avatar
    2020-07-03 김태식

    [질문] 세이지메이커의 작동 원리에서, 사용자가 AWS 알고리즘을 선택할 수 있으며, 텐서플로우 같은 유명 프레임워크에서 불러올 수도 있는데요, 텐서플로우 프레임워크가 하는 역활은 무엇인지요?

  • avatar
    2020-07-03 조창윤

    SageMaker 는 당양한 Framework 을 지원하고 있습니다. 말씀하신 Tensorflow 는 물론 PyTouch, MXNet 은 물론 Scikit-learn 을 지원합니다.
    이미 원하시는 Framework 이 설치되어 있다고 생각하시면 됩니다.


  • avatar
    2020-07-03 박선희

    [질문] 이런 네이블링 등의 목적으로 머신러닝을 수행할 때 필요한 영상이미지가 충분히 있어야 할텐데, 좋은 영상들을 충분히 얻을 수 있는 좋은 방법이 있을까요?

  • avatar
    2020-07-03 bonayaing81

    1) 기본적으로 많이 공개된 데이터들을 활용하시고요, 2) 1번 데이터 set에다 업게 specific한 데이터를 추가해서 같이 합니다.


  • avatar
    2020-07-03 automan

    [질문] 아마존 SageMaker로 학교 교육프로그램으로 활용하는 사레가 있나요?

  • avatar
    2020-07-03 조창윤

    알려진 사례는 많지 않습니다. 과거에 GPU 서버를 직접 사셔서 진행하신 경우가 많았고, 최근에 AWS SageMaker 에 대한 문의가 많아지고 있는것은 사실입니다. Cloud 장점에 Machine Learning 을 쉽게하기 위한 방법을 많이 찾으시기 때문입니다.

  • avatar
    2020-07-03 automan

    답변 감사합니다.
    향후 교육 연게된 모델링 시에 연락드리겠습니다.


  • avatar
    2020-07-03 박미유

    [질문]지금 설명하고 계시는 레이블링 작업에서 어떤 특정 회사나 특정 집단에서만 작업을 하면 레이블링 기준(?)이 동일할 것 같지만 만약 다른 회사나 집단에서도 작업한 것들, 즉 이종 집단에서 레이블링 한 데이터들을 하나로 묶으려 할 때 문제가 생길 것도 같은데(가령 데이터처리시의 샘플링 문제 등) 그건 어떻게 처리를 하나요?

  • avatar
    2020-07-03 bonayaing81

    여려 명에게 배포하는 방식과 과거 labeling하시던 분의 정확도에 따라 해당분의 label에 좀더 weight를 줘서 confidence를 계산하는방법들이 있습니다.


  • avatar
    2020-07-03 김태식

    [질문] 세이지메이커는 기업용 앱을 위한 머신러닝 알고리즘을 개발, 학습, 적용하는 플랫폼으로 인프라 프로비저닝과 관리, 학습 모델 튜닝 등 그동안 머신러닝 개발 시 일반적으로 필요했던 수작업을 상당 부분 없애 주는것으로 알고 있는데요, 일반적인 머신런닝 처리방식에 비해서 AWS 세이지메이커만의 특화된 장점이 있는지요?

  • avatar
    2020-07-03 조창윤

    말씀하신것 처럼 결론은 개발/학습/배포 입니다. AWS SageMaker 을 이용해서 쉽고/빠르게/싸게 진행할 수 있는 것이 특장점이며 이를 위해서 SageMaker 의 정말 많은 기능들이 존재합니다. Autopilot, Processing, Debugger, Monitor, Tuning, Inference flow 등등등. 또한 당연히 AWS Cloud 의 여러 서비스들과 Integration 되어서 진행되기 때문에 SageMaker 의 장점 + AWS Cloud 의 장점이 도움을 줍니다.

  • avatar
    2020-07-03 박우일

    많은 도움이 되는 질문 답변입니다 . 감사합니다.


  • avatar
    2020-07-03 김태식

    [질문] 제가 알기로는 아마존 웹 서비스에서 머신러닝 플랫폼 '세이지메이커를 2017년 12월에 공개를 했는데요, 이를 이용하면 AWS 서비스 사용자가 인공지능(AI) 알고리즘을 더 쉽게 활용할 수 있는데요, 세이지메이커 공개이후 지금까지 업데이트가 어느 수준까지 되었는지 궁금 합니다.

  • avatar
    2020-07-03 bonayaing81

    작년 2019 reinvent(Dec) 에서만 새로 나온 서비스가 및 기능들이 대략적으로 나열해도 debugger, model monitor, A2I studio spot적용, kubflow/airflow operator, TF2 제공, processing, experiment등이 나왔습니다.


  • avatar
    2020-07-03 이종우

    [질문] Amazon SageMaker Studio 도 azure AI studio 처럼 동일한 데이터에 대해서 인공지능 룰들을 다르게 적용해서 결과값을 비교해 볼 수 있나요?

  • avatar
    2020-07-03 조창윤

    당연히 동일한 알고리즘과 동일한 데이터셋이 있으시다면 비교 가능하십니다. 하지만 동일한 알고리즘을 사용했더라도 Hyper-parameter 튜닝 정도에 따라서 결과의 차이는 있습니다. 그렇기 때문에 AWS 또는 Azure 어느쪽에서 더 결과가 좋다는 방향보다 얼마나 편하게, 쉽게, 싸게 좋은 결과를 얻느냐에 집중해주시는 것이 좋을것으로 판단됩니다.


  • avatar
    2020-07-03 골든아이

    확률과 통계의 기본 개념과 식을 이해하고 기본문제 정도를 풀 수 있는 정도의 수학적 지능만 갖춰도 프로그래밍 개발이 가능할까요?

  • avatar
    2020-07-03 조창윤

    프로그래밍은 전문적으로 배우셔야 한다고 판단됩니다. 확률이나 통계 개념이 있으시면 비전공자보다는 빠를수 있습니다.
    간단한 프로그램은 개발할 수 있느나 Deep 한것들은 쉽지 가 않기 때문입니다.


  • avatar
    2020-07-03 차지용

    [질문] 데이터 처리과정 중에 정형데이터 비정형데이터 처리 방식의 런닝 훈련 차이는 무엇인가요?

  • avatar
    2020-07-03 bonayaing81

    어찌됐든 다 수치로 바꿔야 하고요 이미지는 RGB로 정의로 하고요 언어는 word단위로 보통 수치화 합니다.

  • avatar
    2020-07-03 차지용

    답변감사합니다. 혹 AWS에서 사용하는 방법이신건가요? 아님 타사에서도 보편적으로 사용하는 방법인가요?


  • avatar
    2020-06-26 정용배

    [질문] 머신러닝 또는 빅데이터 환경 구축을 위해서는 학습데이터를 준비하는데 많은 비용과 시간이 필요하며 레이블링이 불가능한 AI문제들이 증가하는 리스크가 존재합니다. 이에 대한 대안에 대해 문의드립니다.

  • avatar
    2020-06-26 베이맥스

    https://aws.amazon.com/ko/sagemaker/groundtruth/

    참고 부탁드립니다.


  • avatar
    2020-06-26 CoolGuy

    [질문] 입력 데이터 형식을 지정할 때 CSV 파일 열 헤더 표시 방식은 " " 안에 넣으면 되는 것인지요? 설명 부탁드립니다.

  • avatar
    2020-06-26 베이맥스

    https://docs.aws.amazon.com/ko_kr/personalize/latest/dg/how-it-works-dataset-schema.html

    참고 부탁드립니다.