주요한 포인트를 이미 알고 계신 것 같습니다. DB내에서 직접 고급분석 ML/DL(pl/python, pl/pytho 등) 을 할 수 있습니다.
https://rfriend.tistory.com/635
예? 그 엄청난양의 데이타를 DB내의 모든 데이타에 대해서 분석한다구요? 그런 결코 효율적일 수 없는데요. MAP-Reduce가 나온 이유가 그것이기도 하구요.
[질문] shareplex 가 redo/ achive log를 사용한다고 하셨는데 혹시 redo/archive log에 문제가 생겼다면 복제는 불가능한것인가요?
Archive가 부분 유실 되었다면, Archive 백업본으로 다시 넣어주시고 프로세스를 기동하면 됩니다. 만약 Archive 복원이 불가능 하다면 해당 Archive sequence를 skip 은 가능 하나 해당 archive log에 기록된 DML들은 유실 되어 , Repair로 보정 해야 합니다.
마이크로서비스 아키텍처를 구현할 때 데이터 복사본이 여러 곳에 존재하게 될 것으로 보이는데, 마스터 데이터와 같이 강력한 일관성을 보장해야 하는 데이터는 어떻게 설계/구현을 해야 하나요?
Citrix on MS Azure 환경으로 VDI 를 구축하여 사용하고 있습니다. 임직원의 업무 performance 향상을 위해 클라우드의 자원할당량을 높일 경우, 클라우드 사용료가 기하급수적으로 올라가는 현상이 있는데, 이를 On-premise 로 이전할 경우 비용절감과 성능향상이 각각 어느 정도 효과가 있을지 문의드립니다. 각각의 case 에 따라 다르긴 하겠지만, 평균치의 관점에서 답변 부탁드립니다.
재택근무 트랜드가 적용된 가상화 기술이 보편화 되면서 보안의 중요성도 더 부각되었습니다...가상화 접근방식(직접적인 접근방식과 간접적인 접근방식)에 적용할 수 있는 범용적인 보안 기술은 어떤것이 있나요? 또, 차이점은요?
[질문] 일반적으로 데이터 분석을 위해서는 데이터웨어하우스(DW)나 데이터레이크에서 데이터를 추출해서 워크스테이션에서 머신러닝을 돌리고, 데이터를 모두 워크스테이션으로 가져올 수 없으니 데이터를 샘플링하게 되고, 샘플 데이터가 이동하는 과정에서 속도도 저하되고, 전체 데이터를 분석하는 것이 아니라 분석 품질이 떨어질 가능성도 있어 보입니다. 그린플럼은 이런 이슈 없이 샘플데이터를 추출하지 않고 DB내에서 데이터를 직접 분석 할 수 있는지 궁금하며, 만약 가능하다면 전체 데이터가 분석 대상이 되어 데이터 이동 시간도 필요 없을 것 같은데 어떤지 궁금합니다.