중복제거를 하기 위해서는 실제 스토리지에 저장된 데이터의 딕셔너리를 운영해야 되고, 또 그 딕셔너리를 해시값으로 저장해서 전송되어 오는 데이터와 비교해서 이미 저장되어 있는 데이터는 걸러내고 새로운 데이터만 저장해야 되는데 이때 블록을 비교하는 사이즈가 가변적으로 다양한 사이즈를 가져야 중복을 걸러내는 효율이 높아지게 됩니다.
가변블록과 대비되는 방식이 고정블록 방식입니다. 이 경우에는 고정된 사이즈, 예를 들면 8K 사이즈의 블록의 해시값만으로 비교하기 때문에 중복제거 효율이 떨어지게 됩니다.
시각화 Tool을 활용할 때 가장 어려운 점 중의 하나는 Data Source로부터 대량의 분석 대상자료를 선별해서 가져올 때 소요시간 등과 관련된 문제입니다. Oracle Visualization Tool은 이 부분을 어떻게 지원하고 있는지요
가능합니다. 데이터를 선별해서 가져오는 과정은 시각화 도구에서 'Data Flow'를 활용하거나 Data Set을 생성할 때 '필터'를 적용할 수 있습니다. 또한 직접 SQL로 해당데이터를 선별하여 가져올 수 있습니다.
데이터 시각화 솔루션(클라우드, 데스트탑 버젼)의 사용 비용은 어떻게 되나요? 예를 들어 A사의 경우 Free Tier로 무료 사용기간이 있어서요.
클라우드 버전은 시간당 $1.34부터 시작하며, 자세한 내용은 아래링크를 참고하거나, 담당영업대표를 통해 연락해 주십시오.
https://cloud.oracle.com/en_US/oac/pricing
데스크탑 버전은 ADW(Autonomous Data Warehouse)를 사용하시는 고객은 무료로 사용할 수 있습니다.
Oracle Visualization Tool을 Oracle DB 기반의 Data 분석에 사용할 경우 다른 상용 DB와 연동해서 사용하는 경우와 비교할 때 유리한 점들이 있는지요.
ADW(Autonomous Data Warehouse)는 분석 업무에 최적화되어 있고, Oracle Exadata 기반의 서비스이기 때문에 다른 사용DB와 연동하는 것보다 성능면에서 매우 유리합니다.
가변블록 방식이 어떻게 효율이 좋은지? 원리를 알려주세요.