이전 세대에서도 QAT 2.0을 제공하고 있습니다.
차세대 SPR CPU에서는 암호화 관련 가속기를 CPU 내에 탑재하여 CPU 성능을 최소화하여 암호화 workload를 처리하고 있습니다.
비용이 상관 없다면 최신 CPU의 고클럭과 많은 코어가 여러 워크로드에 대해 유리합니다.
현업에서 보게 되면 시뮬레이션 프로그램 같은경우 High clock이 유리한 경우가 있고, 비용관점에서 코어당 라이선스 비용이 증가하여 선택하기도 합니다. Multi core의 경우 분산 처리가 가능하면 유리한 면이 있습니다. Application 마다 효과적으로 처리할 수 있는 코어수가 달라 프로파일링을 통해 병목을 분석해서 적정 코어를 선택하시는게 유리합니다.
올해 말 이후 Ponte Vecchio 출시 예정입니다. OneAPI 를 통한 다양한 디바이스를 제공합니다. (CPU,GPU,FPGA 등)
Nvidia GPU 대비 수 배 더 나은 성능을 제공할 예정입니다. AVX512를 통해 데이터 처리 가속화를 수행할 수 있습니다.
해당 질문은 PC용 CPU 질문인데요. P코어는 performance core로 Heavy workload를 감당하고, E코어는 efficient core로 전력 효율적으로 연산을 수행합니다.
차세대 GPU인 Pontevecchio를 준비하고 있으며, CUDA는 oneDNN을 통해 대응하고 있습니다. PyTorch/Tensorflow와 같은 AI프레임 워크에도 최적화 작업을 진행하고 있습니다.
고성능 CPU 클라우드 인스턴스를 활용하여 데이터로 전처리를 진행할 수 있습니다.
우선 CPU로 AI 서비스 개발에 집중을 하시고, AI workload가 Heavy할 경우 Workload를 넘기는 것도 방법이 될 수 있습니다.
안녕하세요.