데이터셋 품질은 모델보다 더 큰 비중으로 성능을 좌우하기 때문에, 지도학습 task의 경우 데이터에 대해 세심한 고려가 필요합니다.
[질문] 업무적으로 사용하는 폰의 경우 MDM을 설치하여 주의를 할 수 있겠지만 직원들 개인 휴대폰에 설치하여 관리하는 것은 반발도 있고 여러가지 어려움이 있을 것 같은데 어떤 해결책이 있을까요?
개인용 Apple 기기에 MDM을 등록하여 사용하는 경우 사용자가 희망할 때 기기를 MDM의 관리에서 벗어날 수 있습니다.
뿐만아니라 MDM은 Apple의 정책에 따라 개발되기 때문에 사용자의 개인정보를 침해하지 않습니다.
따라서 업무시간에만 MDM의 관리를 받고, 업무 외 시간에는 개인의 기기로 돌아가서 사용하는것이 가능합니다.
그러면 업무 시간외의 침해에 대해선 취약해 지지 않나요
이런 경우 관리자 업무 부담이 증가하지 않을까요? 외부 활동이 잦으면 매번 설정하고 해제하고 번거로울 것 같기도 하구요.
QR코드를 통해 간단하게 등록하고, 기기 내에서 관리에서 벗어날 수 있습니다.
취합된 로그를 통해 사용자별로 확인하여 업무 부담없이 기기의 보안을 유지할 수 있습니다.
pretrain 모델의 경우, 기업들이나 다양한 연구기관에서 공개된 모델을 사용할 수 있겠지만, 특정 태스크 수행을 위한 fine-tuning시에는 결국 데이터셋을 구축해야하는데, 기계독해, 번역, NER, STS 등 과 같은 fine-tuning용 데이터셋 구축하는 것 자체가 너무나 어렵습니다, 따라서 결국 많지 않은 오픈된 데이터셋을 사용할 수 밖에 없고, 기대하는 성능을 기대하기 어렵더라구요. 데이터셋 품질이 않좋다면 모델링 아무리 잘해도 성능 개선하기 어렵다고 생각하는데 어떻게 생각하시나요?