여려 명에게 배포하는 방식과 과거 labeling하시던 분의 정확도에 따라 해당분의 label에 좀더 weight를 줘서 confidence를 계산하는방법들이 있습니다.
시각화 Tool을 활용할 때 가장 어려운 점 중의 하나는 Data Source로부터 대량의 분석 대상자료를 선별해서 가져올 때 소요시간 등과 관련된 문제입니다. Oracle Visualization Tool은 이 부분을 어떻게 지원하고 있는지요
가능합니다. 데이터를 선별해서 가져오는 과정은 시각화 도구에서 'Data Flow'를 활용하거나 Data Set을 생성할 때 '필터'를 적용할 수 있습니다. 또한 직접 SQL로 해당데이터를 선별하여 가져올 수 있습니다.
데이터 시각화 솔루션(클라우드, 데스트탑 버젼)의 사용 비용은 어떻게 되나요? 예를 들어 A사의 경우 Free Tier로 무료 사용기간이 있어서요.
클라우드 버전은 시간당 $1.34부터 시작하며, 자세한 내용은 아래링크를 참고하거나, 담당영업대표를 통해 연락해 주십시오.
https://cloud.oracle.com/en_US/oac/pricing
데스크탑 버전은 ADW(Autonomous Data Warehouse)를 사용하시는 고객은 무료로 사용할 수 있습니다.
Oracle Visualization Tool을 Oracle DB 기반의 Data 분석에 사용할 경우 다른 상용 DB와 연동해서 사용하는 경우와 비교할 때 유리한 점들이 있는지요.
ADW(Autonomous Data Warehouse)는 분석 업무에 최적화되어 있고, Oracle Exadata 기반의 서비스이기 때문에 다른 사용DB와 연동하는 것보다 성능면에서 매우 유리합니다.
[질문]지금 설명하고 계시는 레이블링 작업에서 어떤 특정 회사나 특정 집단에서만 작업을 하면 레이블링 기준(?)이 동일할 것 같지만 만약 다른 회사나 집단에서도 작업한 것들, 즉 이종 집단에서 레이블링 한 데이터들을 하나로 묶으려 할 때 문제가 생길 것도 같은데(가령 데이터처리시의 샘플링 문제 등) 그건 어떻게 처리를 하나요?