데이터 오케스트레이션이라고 볼 수 있을 것 같습니다(개인적인 의견입니다.)
가장 중요한 것은 기업의 규모보다는 어떠한 데이터를 가지고 계신지가 중요할 것 같습니다. 목표 타깃은 존재하는데 데이터의 규모나 레이블링 유무에 따라 그 가치가 전혀 다를 것 같습니다. 기업에 가지고 계신 데이터가 ML적용 가능한 수준인지 고려하는것이 좋을 것 같습니다.
데이터이쿠는 저사항 PC서 부터 클러스터링 환경까지 모두 지원이 가능합니다. 표준스텍은 존재하지 않지만 사용 User수에 따라 적당한 스펙을 할당 할 수 있을 듯 합니다. 만약 1-2개의 현업부서에서 시험환경으로 사용하신다면 16코어 32기가램 환경으로 시작하셔도 충분할 듯 합니다.
기업의 임직원수를 기준으로 세부적인 요금제가 존재합니다. 별도로 문의 주시면 상세히 답변 드리도록 하겠습니다.
https://doc.dataiku.com/dss/latest/machine-learning/algorithms/mllib.html# 참고하시면 사용 가능한 내장 라이브러리를 확인 할 수 있습니다.
기본적으로는 솔루션 설치/운영이 기본이 되겠지만 프로젝트 진행 시에 아키텍쳐 모델링 컨설팅은 용역 형태로 계약하여 서비스 제공이 가능합니다. 다만, 프로젝트 진행시 당연히 제공해야할 기본 교육은 포함되어 있습니다.
이커머스 분야에서는 주로 high revenue 고객에 대한 예측과 프로모션을 적용하였을때 효과를 높을 수 있는 고객 예측에 대한 레퍼런스가 있습니다.
데이터이쿠는 기본적으로 샘플링 데이터에서 테스트를 수행하고 완료 후 전체데이터에 적용하는 방법을 쓰고 있습니다. 컴퓨팅파워를 많이 쓰는 알고리즘을 실수로 돌린다고 하더라도 특별한 문제가 발생한 경우는 없었습니다
반도체 수율예측과 불량률 원인은 하이닉스에서 가장 중점적으로 보시는것 같습니다. 불량 수치는 예측값을 AI기반으로 도출 할 수 있습니다. 또한 AI 도출한 예측값의 상관관계와 가장 관계성이 높은 요소를 시각화 할 수 있습니다. 다만 기존 수율 분석 시스템을 저희가 정확히 알지 못하여 직접 비교하기는 어려울 것 같습니다.
6시그마에 적용된 사례는 아직까지 확인하기 어렵습니다. 하지만 기본적으로 데이터이쿠의 레퍼런스는 제조업 분야에서 불량률 예측을 가장 많은 레퍼런스로 보유하고 있습니다.
일반적으로 학습 기간을 확정하긴 어렵습니다. AI학습은 새로운 히스토릭 데이터를 적용해서 지속적으로 업그레이드하는것이 목표입니다.
이 질문사항에 대한 답변은 아무래도 SK하이닉스의 발표자분들이 인사이트를 가지고 계실 것 같습니다. 기본적으로는 인자값은 기존의 수ㅇㄹ결과가 있는 라벨링 데이터를 사용하고 랜덤하게 학습과 테스트 결과를 나누는것이 보통입니다.
프랑스에서 시작하여 본사는 미국에 있습니다.
데이터이쿠 플랫폼을 AI업무환경을 통합할때 큰리스크리는 존재하지 않습니다. 아무래도 플랫폼을 도입한 이후에도 각 부서나 현업 담당자 분들이 같이 플랫폼안에서 협업체계가 이루어 지지 않는다면, 플랫폼 도입의 장점이 없어질 수 있을 것 같습니다.
아무래도 많은 선행 작업이 필요하겠지만 데이터 라베링 작업이 우선될 것 같습니다. 라벨링 작업시에 업무 표준화나 데이터 정규화 타겟팅 작업등이 부수적으로 동반될 듯 합니다
데이터이쿠는 일본어 이쿠 와 데이터의 합성어로 데이터의 시조라는 뜻입니다.
[답변] 데이터이쿠는 일본어 이쿠 와 데이터의 합성어로 데이터의 시조라는 뜻입니다.