문제마다 달라질 것이기 때문에 정확한 비율로 얘기하기는 어렵겠지만 데이터파이프라인의 경우가 일반적으로 훨씬 많은 리소스가 소요됩니다. 데이터 파이프라인에서 관리해야 하는 데이터의 양이 더 많기도 하고 데이터의 소스가 추가되거나 운영중 프로그램 변경으로 인해 유입되는 데이터가 약속된 형태에서 바뀌는 등 많은 이슈들이 발생하게 되고 이를 모두 관리하는 데에 많은 툴과 시간을 투자하시게 됩니다.
답변 감사합니다. 현재 소속된 조직에서도 단기적 성과물에 집착해서 앞단인 Data Pipeline에 대해서는 등한시하는 상황입니다. 그래서 실제 실무자들은 앞단에 발목이 잡히거나 일을 위한 일을 양산하고 있지요...
불량판단시 여러가지 불량이 같이 있는 경우는 어떻게 학습하면 좋을까요
여러 방법이 있을 듯 싶지만 여러 네트워크를 이용해서 각 불량을 학습시키면 어떨까 싶습니다.
회전하는 주물 가공품의 찍힘, 기포, 가공 떨림등의 감성적인 결함도 검출이 가능한건가요?
회전 속도가 어떤가 싶습니다. 고속 카메라를 통해 흔들림 없이 이미지를 취득가능하면 가능할 듯 싶습니다.
[질문] 1.딥러닝 기본엔진 국산인지? 2.딥러닝기초데이터 초기때 검색시간과 누적된 대용량 DB 생성시 검색시때문에 지연관련 문제는 없는지?
1. DeepLearning의 기본 엔진은 모두 nvidia의 cuda(cudnn)기반이라 국산이라고 말씀드리가 힘들겠네요.
2. 산업용에 특화된 데이타의 경우 대부분 분류가 되어있고 DB화 되어 있어 검색이나 지연 문제는 문제가 되지 않았네요.
[질문] 분류 모델 특징을 추출하는데 라온만의 특정 알고리즘을 이용하신다는 말이줘?
네 맞습니다. 기존 오픈된 알고리즘에서 산업용에 맞게 저희 만의 알고리즘으로 특화 시켰습니다.
사용하는 딥러닝 네트웍 모델이 정확히 무엇인지요?
죄송하니지만 그 부분은 정확히 말씀 해 드리기 함든 점 이해 주시길 바랍니다.
network 모델을 어떻게 설계했는지가 중요한데 cuda를 썼다고 국산이 아니라는 것은 잘 못 된 설명입니다.
네 관점이 기본 엔진이라는 문의하셔서 너훈님 말씀 처럼 network 모델 과점이라면 그럴 수 있겠네요
[질문] 기본적인 기존 딥러닝 알고리즘을 사용하여 분류를 하는건가요? 라온만의 새로운 구조를 만드신건가요?
산업 현장에서 필요한 정확도 및 처리 속도 문제로 기존 알골리즘 및 Framework 기반으로 저희만의 딮러닝 알고리즘 및 framework(Train) 최적화 시켰습니다.
AI Trainer Ver2 MERCURY는 Train/Test Dataset을 몇장을 사용하시나요?
이 부분은 시료의 특성에 따라 달라지므로 일반화 시켜 말씀 드리기 힘들지만 적어도 train시키기 위해 최소 class마다 20장 이상을 요청 드리고 있습니다.
[질문]cognex 사의 cognex explorer 같이 사용자가 직접 프로그램을 할 수 있는 라인도 있나요? 아니면 사업 영역이 직접 개발까지 해주시는 것만 인가요?
NAVI라는 framework을 이용하여 바로 사용이 가능한 부분도 있고 라이브러리 형태로 제공해 드립니다.
[질문] 분류를 할려면 기본적으로 현장 데이터가 있어야 할것 같은데요. 이 데이터는 어디에서 수집을 해야 하는건가요 그리고 그 결과에 대한 신뢰성을 어떻게 파악할 수가 있는건가요?
시료는 고객사에서 데이타를 취득해서 저희에게 주거나 실제 촬영을 통해 취득합니다. train set밍 test set을 분리하여 신뢰성을 측정합니다.
[질문] 여기서 딥러닝 기술은 분류 로직을 활용하는건가요 ? .
분류인 classification뿐만 아니라detect/segmentation 분야 이용합니다.
[질문] 흔히들 얘기하는게 Data Pipeline 단을 구성하는게 전체 업무의 대부분을 차지한다고 얘기합니다. 오늘 주제인 배포와 운영 관점에서 두 Pipe Line 구성에 어느 정도 비율로 Resource가 할당되어야 할까요?