이부분에 대해서는 여러 회사에서 여러 제품이 나와 있습니다. 아직 이런 데이터 클랜징 및 라벨링 관련해서 자동으로 유의미하게 처리해주는 서비스는 제가 잘모르겠습니다. 전통적으로 데이터 분석 서비스에서 고객님께서 질문해주시는 그 부분을 처리하기 위해 여전히 많은 시간이 투입되고 있는 실정입니다.
[질문] VM과 컨데어너의 가장 큰 차이점은 GUEST os의 유무인데 이 GUEST OS가 무겁고 이에 대한 화환성에 문제가 있어서 인것으로 생각되는데 컨테이너가 수만개 만들어서 그것은 관리하기가 어려운데 컨데이터의 구성요소를 좀 더 늘리고 그 수를 줄여서 관리를 좀 더 쉽게 할 수 있는 방안은 없는지요?
[질문] DW를 관리하려면, 데이터 품질관리도 관리 되어야 할텐데요. 기존 데이타를 새로 분류작업,라벨링 기술이 어느 정도 자동화되어 기간이 걸릴까요 ? 자료를 형식(format)에 따라 작업난이도에 많은 차이가 있을까요 ?