데이터 메쉬와 데이터 레이크의 가장 큰 차이점은 데이터를 관리하는 방법일 것입니다. 데이터 레이크가 한 곳의 저장공간에 데이터를 모아서 관리하는 중앙 집중식 데이터 관리 방법이라면, 데이터 메시는 데이터 관리의 주체를 데이터를 생산하는 팀으로 정의하고 (데이터 도메인 팀) 여기에 관리에 책임과 권한을 주는 분산형 모델입니다..
답변 감사합니다. 데이터 메쉬는 데이터 도메인 팀이 도메인 별도 있으려면 자동화로 인력을 줄이는 현대 방향과는 좀 역행하는 것 아닌가요? 그리고 도메인 지식을 가진 팀이 없다면 데이터 메쉬의 효과가 확 떨어질 것 같은데 아닌가요?
네. 말씀하신데로 데이터 도메인 지식을 가진 팀이 없다면 데이터 메시는 그 효용성이 많이 떨어집니다. 그래서 데이터 메쉬는 큰 규모의 업체에서 중앙 집중적 데이터 레이크가 잘 운영되지 않을경우 그리고 각 팀에 권한을 주고 데이터를 관리할 수 있도록 하는 경우가 많습니다.
또한 데이데 메쉬의 기본이 되는 것이 데이터 제품을 만드는 프소세스를 최대한 자동화해서 각 팀에서 개발자가 아니더라도 데이터 제품을 만들고 관리 할 수 있는 그러한 플랫폼이 중요시 됩니다.
예 답변 감사합니다. 대기업같은 경우는 데이터 EA도 잡을 수 있어서 아주 좋을 것 같네요.
[질문]
사용자 계정 기반 서비스할때
다음 세가지 고민을..
첫째, 한번 로그인해서 여러시스템에 자동적으로 접근해서
사용하면 좋겠는데...
둘째, 다양한 솔루션 시스템에
tenant 및 사용자별로 접근권한을 가지고 통제가 되면 좋겠는데..
세째, 여러 고객사의 사용자관리를 고객사별로 쉽게 구분하면서 안전하게 통합관리하면 좋겠는데...
현실적으로 방법이 있을까요,,
[답변] 안녕하세요?RSA 입니다.
첫째, SSO로 해결하실 수 있습니다.
둘째, 인증 통합 후 네트워크 구간 별 접근제어 정책으로 해결하실 수 있습니다.
셋째, 인증 후 사용자의 정보를 구분하여 접근제어 정책으로 해결하시 수 있습니다.
[질문] 딥러닝 기반 비전 검사 모형은 내부에 있는 현업 담당자가 오류(품질 정도)를 마킹을 해서 데이터를 만들어 주면 된다고 하셨는데, 그렇게 준비해야 하는 데이터의 량이 얼마나 필요할까요? (물론 대상마다 다르겠지만) 해당 비전 모듈을 도입하려면 (비록 전문 비전 프로그래머가 투입되지는 않아서 비용에 대한 세이브는 이미 많이 되었지만 대신에) 현업 담당자의 노력이 들어가야하는데 평균 투입 노력은 어느 정도(몇 M/M or 데이터 건수) 생각해야하나요?
일반적으로 유형별 이미지는 20~50장 정도면 대략 95% 이상의 정밀도의 결과를 예상할 수 있습니다. 학습 데이터는 양보다는 질이 중요합니다.
유형 별로 정제된 학습 셋을 얻는 시간은 상황에 따라 달라서 정량적으로 표현하기는 어려울 듯 합니다.
[질문] 기계를 학습 시킨다면 기계가 올바르게 인식했을때 상을 주고, 잘못 인식했을때 벌을 주는 형태가 되어야 할 건데요. 전문가가 아닌 일반인이 기계를 학습 시키기 위해 어떤 자료를 얼마나 제공해야하고 상벌은 어떻게 줘야 하고 예기치 못한 상황이 발생했을때 어떻게 조치해야 하는 지 등에 대해 어려움 없이 잘 처리 할 수 있을까요..?
산업용은 정확도가 가장 중요한 요소이므로 항상 가장 실력이 좋은 교육자가 교육을 해주어야 좋은 결과를 얻을 수 있습니다. 일반인이 학습한다면 일반인 수준의 결과, 전문가가 학습하면 전문가 수준의 결과가 도출되겠지요.
데이터는 유형별로 약 50 장 이상의 이미지를 제공해 주면 좋습니다.
[질문] 새로운 제품이나 새로운 불량에 대해서는 항상 학습을 시켜야 하나요?
새로운 유형의 불량이라면 학습을 시켜야 합니다. 다만 형태가 변형되는 등의 변화에 대해서는 일반화가 충분히 가능하여 매번 학습할 필요는 없습니다.
[질문]구글 클라우드 데이터랩만의 강점은 무엇인가요?
Google Cloud 의 Cloud Service Resource 를 쉽게 연동하여 사용할 수 있다는게 큰 강점입니다.
클라우드는 처음이라...
데이터는 일반 운영데이터를 적재 분석 및 시각화를 하게 되는건가요?
네, 적재 된 데이터를 datalab 을 이용하여 시각화 하는 것입니다.
[질문] 데이터 웨어하우스와 데이터레이크의 장점인 성능과 비정형데이터수용이 가능한 레이크하우스가 뜨고 있는데 데이터 메쉬도 레이크하우스의 특징을 다 가지고 있는지요? 또 이 둘간의 차이점은 무엇인가요?