제조분야 비전 검사는 크게 다음 3가지 문제가 있고 스누아이랩은 다음과 같은 솔루션으로 접근하고 있습니다.
1. 환경 변화: 신규 라인 증설, 조명, 기구, 센서 등의 변경으로 학습된 특징이 변경되는 드리프트(Drift)가 발생하여 성능이 저하됩니다. 보통은 신규 데이터를 수집하고 학습하는 작업으로 이를 해결합니다. 스누아이랩은 Active Learning 기반의 Sampling 기술로 기존 데이터에 신규 데이터를 소량 썩어서 성능을 유지하도록 합니다.
2. 클래스 불균형: 불량률이 적어서 불량 이미지를 수집하기 어렵습니다. 보통은 과탐을 극대화아고 불량률을 0%로하고 육안 검사로 불량을 검출합니다. 스누아이랩에서는 1차 분류 모델 후 2차 이상 탐지 모델로 육안 검사에 대한 노력을 줄이도록 하고 있습니다.
3. 재학습: 머신러닝 분야는 재학습이 수반됩니다. 재학습을 위해서는 숙련된 머신러닝 기술자가 학습해야합니다. 스누아이랩에서는 일반적인 기술자가 설정된(Coordinated) 환경내에서 재학습을 할 수 있도록 플랫폼을 제공하여 기술 난이도를 낮추었습니다.
[질문]Veritas Netbackup Appliance 5240으로 비정형 데이터의 백업을 하려고 헸는데 지금 소개한 access 제품으로 대체 가능한 것인지요?
OS 백업용으로 별도 전용 제품을 써야하는지 ACCCESS로도 할 수 있는지 궁금합니다.
Access 제품은 장기보관 데이터의 보관을 위해서 특화된 장비 입니다. 그래서 일반 NetBackup Appliance 대비 대규모의 데이터를 장기보관하는 것에 특화된 것입니다. 말씀하신것츠럼 OS백업 데이터를 Access로 저장할 수 있습니다.
[질문] 현재 db 등의 데이터 저장 VTL, PTL과 CCTV 영상 저장 NVR 그리고사진등 파일 저장 서버를 운영중입니다. SDS솔루션으로 통합 운영이 가능한지요?
VTL를 통한 1차 백업과 PTL로의 2차 백업을 VERITAS의 NetBackup Appliance로 대체 가능합니다. 그리고 PTL이 담당했던 장기보관데이터를 지금 방송에서 설명드리는 Access Appliance로 저장할 수 있습니다. 전체적인 데이터를 VERITAS의 Appliance로 대체 하여 운영하실 수 있습니다.
정확히 얘기하면 청약서 스캔이미지와 상담 통화 녹취파일 들인데 보관량이 엄청납니다.
청약서등의 이미지파일과 스캔이미지등등 중복제거가 잘 되지 않는 데이터를 보관해야 하는 상황에서 Public Cloud에 데이터를 저장할 경우 Cloud Vendor로 지불하셔야 하는 비용이 과다하실 수 밖에 없습니다. 이러한 상황에서 On Promise환경의 Object Storage에 데이터를 중복제거해서 저장하시는 방안도 하나의 대안일 것 같습니다. 물론 이미지 데이터라서 중복제거율을 좋지 않을수도 있는 부분은 감안해야 할 것 같습니다.
[질문]azrue 등 cloud 에 올라와 있는 데이터에 대한 분석 및 시각화도 지원이 된느지요?
네. 다양한 클라우드 플랫폼과 연동 가능합니다. 자세한 내용은 상담 신청을 해주시면 찾아뵙고 설명드리도록 하겠습니다.
[질문]혹시 마음에 들지 않아 다른DB및 빅데이타를 이용한다면 마이그레이션 지원이 가능할까요?
다양한 이기종의 DB와 마이그레이션을 하실 수 있습니다. 상담을 주시면 자세히 안내드리도록 하겠습니다.
[질문] 쇼핑몰에서 고객의 행동/구매 패턴 분석등을 통해 맞춤상품 추천을 머신러닝하고 빅데이터 상에서 알고리즘화하여 제안하고 싶은데 이런 유사 적용예가 있는지요?
네. 고객에 대한 360도 view를 확보하고 이를 통한 advanced analytics를 지원합니다. 사례에 대해서는 상담 신청을 해주시면 찾아뵙고 자세히 설명드리도록 하겠습니다.
아직 정확히 정의가 이해가 안되는데요, "데이터 블렌딩"의 의미좀 다시 한번 요약 정리 한번 부탁합니다.
데이터 블랜딩은 데이터 수집 , 처리 , 통합의 의미를 포함하고 있습니다. (예를들어 기존의 데이터 저장소와 신규 도입하신 하둡과 통합 등)
[질문]구축 초기에 주의할점이나 신경써야할점이 있을까요?
구축 환경을 말씀해주시면 상담해 드리도록 하겠습니다. 감사합니다.
오픈소스 계열의 알고리즘도 적용 가능한가요?
R, Python, weka 등의 오픈소스 알고리즘을 활용 가능하십니다.
머신러닝 알고리즘의 특성에 따라 분석 결과가 달라질텐데 상호 보완할수 있도록 앙상블 구성도 가능한가요?
펜타호 첼린지 모델 업데이트 기능을 통해 다양한 알고리즘 혹은 앙상블 모델 중 가장 좋은 모델을 찾아 줍니다.
감사실 소속입니다.
빅데이터 솔루션으로 부정조사를 활용할 수 있는 방안이 있을까요?
미국금융감독원에서 신용불량 분석을 활용한 사례가 있습니다. 부정조사 데이터를 활용한다면 가능 할 수 있을 것 같습니다.
[질문] 미세먼지 실시간 측정과 같이, 실시간으로 제공되는 데이터의 경우, 완전히 가공되지 않은 파일은 어느정도까지 지원되실지요?
질문감사드립니다. 가공되지 않은 파일에 대한 파싱/정제 기능을 거쳐서 분석 가능한 데이터로 처리하는 과정을 거칩니다. 자세한 내용은 상담 신청을 해주시면 찾아뵙고 설명드리도록 하겠습니다.
[질문] Pentaho 를 IT Security 분야에서 공격 예측이나 공격 추이 분석을 한 레퍼런스나, 분석할 수 있는 인사이트가 있나요?
네. 말씀하신 Cyber Security 사례의 레퍼런스가 있습니다. 자세한 내용은 상담 신청을 해주시면 찾아뵙고 설명드리겠습니다~!
[질문] 제조 현장에서 제품 표면 불량 유.무를 Deep Learning 으로 이용중에 있습니다. 저희도 정합성이 높긴 한데 귀사의 정합성은 어느정도이며, 과검은 또 어느정도 되는지 궁금합니다.