성능¶
리벨리온 ATOM NPU 및 추론용으로 널리 사용되고 있는 GPU, NPU 가속기의 요약된 성능을 확인할 수 있습니다. 아래 테이블의 모든 성능 기록은 MLPerfTM Inference v3.0 공식 결과를 기반으로 작성되었습니다.
-
비전 모델 / ResNet50
Vendor Accelerator Single Stream Latency Relative Latency Rebellions RBLN ATOM 0.239 ms x1.0 Qualcomm Cloud AI100 0.336 ms x1.4 Nvidia A2 (Ampere) 0.713 ms x3.0 Nvidia T4 (Turing) 0.818 ms x3.4 -
언어 모델 / BERT-Large
Vendor Accelerator Single Stream Latency Relative Latency Rebellions RBLN ATOM 4.297 ms x1.0 Qualcomm Cloud AI100 7.547 ms x1.8 Nvidia A2 (Ampere) 8.506 ms x2.0 Nvidia T4 (Turing) 6.093 ms x1.4
더 자세한 내용은 MLPerfTM Inference v3.0 공식 홈페이지를 참고하시기 바랍니다.