성능¶
리벨리온 ATOM™ NPU 및 추론용으로 널리 사용되고 있는 GPU, NPU 가속기의 요약된 성능을 확인할 수 있습니다. 아래 테이블의 모든 성능 기록은 MLPerfTM Inference v3.0 공식 결과를 기반으로 작성되었습니다.
-
비전 모델 / ResNet50
Vendor Accelerator Single Stream Latency Relative Latency Rebellions RBLN ATOM™ 0.239 ms x1.0 Qualcomm Cloud AI100 0.336 ms x1.4 Nvidia A2 (Ampere) 0.713 ms x3.0 Nvidia T4 (Turing) 0.818 ms x3.4 -
언어 모델 / BERT-Large
Vendor Accelerator Single Stream Latency Relative Latency Rebellions RBLN ATOM™ 4.297 ms x1.0 Qualcomm Cloud AI100 7.547 ms x1.8 Nvidia A2 (Ampere) 8.506 ms x2.0 Nvidia T4 (Turing) 6.093 ms x1.4
더 자세한 내용은 MLPerfTM Inference v3.0 공식 홈페이지를 참고하시기 바랍니다.