[질문] 쇼핑몰에서 고객의 행동/구매 패턴 분석등을 통해 맞춤상품 추천을 머신러닝하고 빅데이터 상에서 알고리즘화하여 제안하고 싶은데 이런 유사 적용예가 있는지요?
네. 고객에 대한 360도 view를 확보하고 이를 통한 advanced analytics를 지원합니다. 사례에 대해서는 상담 신청을 해주시면 찾아뵙고 자세히 설명드리도록 하겠습니다.
아직 정확히 정의가 이해가 안되는데요, "데이터 블렌딩"의 의미좀 다시 한번 요약 정리 한번 부탁합니다.
데이터 블랜딩은 데이터 수집 , 처리 , 통합의 의미를 포함하고 있습니다. (예를들어 기존의 데이터 저장소와 신규 도입하신 하둡과 통합 등)
[질문]구축 초기에 주의할점이나 신경써야할점이 있을까요?
구축 환경을 말씀해주시면 상담해 드리도록 하겠습니다. 감사합니다.
오픈소스 계열의 알고리즘도 적용 가능한가요?
R, Python, weka 등의 오픈소스 알고리즘을 활용 가능하십니다.
머신러닝 알고리즘의 특성에 따라 분석 결과가 달라질텐데 상호 보완할수 있도록 앙상블 구성도 가능한가요?
펜타호 첼린지 모델 업데이트 기능을 통해 다양한 알고리즘 혹은 앙상블 모델 중 가장 좋은 모델을 찾아 줍니다.
감사실 소속입니다.
빅데이터 솔루션으로 부정조사를 활용할 수 있는 방안이 있을까요?
미국금융감독원에서 신용불량 분석을 활용한 사례가 있습니다. 부정조사 데이터를 활용한다면 가능 할 수 있을 것 같습니다.
[질문] 미세먼지 실시간 측정과 같이, 실시간으로 제공되는 데이터의 경우, 완전히 가공되지 않은 파일은 어느정도까지 지원되실지요?
질문감사드립니다. 가공되지 않은 파일에 대한 파싱/정제 기능을 거쳐서 분석 가능한 데이터로 처리하는 과정을 거칩니다. 자세한 내용은 상담 신청을 해주시면 찾아뵙고 설명드리도록 하겠습니다.
[질문] Pentaho 를 IT Security 분야에서 공격 예측이나 공격 추이 분석을 한 레퍼런스나, 분석할 수 있는 인사이트가 있나요?
네. 말씀하신 Cyber Security 사례의 레퍼런스가 있습니다. 자세한 내용은 상담 신청을 해주시면 찾아뵙고 설명드리겠습니다~!
대용량의 데이터 수집 및 적재시 커스터마이징 분석도 가능한가요?
대용량 데이터 처리에 최적화된 펜타호 엔진을 보유하고 있어 수집 및 분석 유용합니다.
[질문] 데이타 소스를 Datalake에서도 가져올 수 있나요?
네. 시장에 사용되고 있는 대부분의 데이터 소스를 지원합니다. Hadoop 기반으로 구축되어 있는 data lake에서도 데이터 연계가 가능합니다~
[질문]해당 플랫폼의 경우 상당한 예산이 필요할것으로 예상이 되는데요, 중소기업에서 도입한 사례가 많이 있나요? 중소기업용으로 차별화된 기능으로 도입금액을 줄이는 방법도 있나요?
중소기업에서도 커뮤니티에디션을 사용하여 업무에 활용하시는 경우도 있습니다.
다만 커뮤니티 에디션을 사용하실 경우에는 별도의 기술지원을 받기는 어려우시며, 보통 자체적인 인력으로 커스터마이징 및 관리하시는 것으로 알고 있습니다.
IT인프라에서 운영중인 시스템 제조사 또는 솔루션 별로 모든 제품군이 호환 가능한가요?
다양한 제품품군과 연결성을 지원하고 있습니다. 세부적인 환경을 문의주시면 상담드리도록 하겠습니다.
혹시.. 어떤 오픈소스를 기반으로 팬타호가 만들어 졌는지 알려주실 수 있으실까요? ^^;
Java 기반으로 만들어졌습니다.
펜타호는 두 가지 에디션이 있습니다. 오픈소스인 커뮤너티 에디션이 있고, 상용 엔터프라이즈 에디션이 있습니다.
[질문] WEKA 분석 툴을 사용하는 사례나 데모를 보여주시면 감사하겠습니다.
시간 관계상 오늘 WEKA 연동 데모를 보여드리지는 못했지만, 많은 사례를 보유하고 있습니다. 상담 신청을 해주시면 찾아뵙고 자세한 설명을 해드리겠습니다~!
DB는 온니 티베로만 가능한가요?
티베로 데이터베이스는 펜타호에서 연결 가능한 다양한 데이터베이스 중 하나입니다. :)
[질문] 리테일 인더스트리에서 기존데이터를 집어넣고 머신러닝을 해서, 수요예측한(판매량예측) 레퍼런스가 있을까요?
해외 Retail 사업분야에 Pentaho 적용사례들을 가지고 있으며 Pentaho 데이터 사이언스팩을 통해 수요예측을 할 수 있습니다.
지금 보이는 Spoon의 작업 모습은 SAS와 유사해 보이는데요. 다른 차이점이 있을까요?
Spoon은 펜타호의 데이터 처리를 하는 Client 도구입니다. 자세한 내용은 상담 신청을 해주시면 태균님께서 궁금해하시는 내용을 찾아뵙고 설명드리도록 하겠습니다.
[질문]data science라는 직군이 우리나라에도 있는지? 일반기업이 빅데이터 경영을 진행 한다고 하면 어떤 로드맵을 구상 해야 하는지에 대한 방안을 부탁 드림니다.
최근 데이터 사이언스 직군이 국내에도 활발하게 운영되고 있습니다. 빅데이터 경영은 기업에 맞게 상담을 받으시는게 좋으실듯 합니다.
[질문]감사합니다. 빅데이터 자료가 정형화된 자료를 모야야되는건지, 아니면 형식이 정해지지 않은 데이터도 분석이 가능한지요?
정형 및 비정형 데이터를 전처리를 통해서 분석이 가능한 형태로 만들 수 있습니다.
그래서 지금 퓨어 스토리지 제품을 도입한다면(20TB 미만 엔트리 급) NVMe 아키텍처가 적용되어 있다는 말씀이지요?