중복제거란 데이터를 일정 블록 단위(보통 4k)로 쪼개서 중복되지 않는 블록들만 저장합니다. 예를 들어서 ABCD라는 파일과 ABBD라는 파일들이 있을때 앞의 파일을 A, B, C, D라는 블록으로 쪼개지고 뒤의 파일은 A, B, B, D라고 쪼개질때 두 파일의 실제 데이터가 저장되는건 A, B, C, D 하나씩 저장되는 형태입니다. 같은 파일의 경우에는 실제로 같은 블록사이즈로 쪼개지기 때문에 인덱싱을 위한 부분을 제외하고는 완벽하게 중복데거가 될거라고 생각합니다.
[질문]VAST Data의 유니버셜스토리지에서 압축,중복제거를 사용하면서 성능의 저하가 거의 없다라고 하신 부분은 GPU Direct를 통해서 해결되었다고 이해를 했는데 이해한게 맞을까요? 그리고 중복제거 및 압축을 진행했을 때 성능저하가 전혀 없지는 않을 것 같은데 성능저하 비율과, 중복제거 비율에 대한 정량적 수치가 궁금한데 데이터가 있을까요?
안녕하세요