콘텐츠로 이동

개요

RBLN SDK는 RBLN NPU 장치를 관리, 모니터링 및 유지보수하기 위한 종합적인 커맨드 라인 도구 모음을 제공합니다. 이러한 도구를 통해 시스템 관리자, 개발자 및 운영자는 프로덕션 환경에서 RBLN 하드웨어를 효과적으로 활용할 수 있습니다.

관리 도구

RBLN 관리 도구는 다음과 같은 유틸리티로 구성됩니다:

도구 목적 주요 사용 사례
rbln-smi 시스템 관리 인터페이스 장치 모니터링, 리소스 추적, 성능 관리, 프로세스 검사
rblnBandwidthLatencyTest 성능 테스트 대역폭 측정, 지연 시간 테스트, 토폴로지 검증, 시스템 벤치마킹
rblnvs 검증 스위트 BIOS/GRUB 검증, 팬 속도 모니터링
rbln-flash 펌웨어 업데이트 유틸리티 CP/MCU 펌웨어 업데이트
RSMD 시스템 관리 데몬 백그라운드 장치 모니터링, gRPC API 서비스, 이벤트 로깅

도구 카테고리

모니터링 및 관리

rbln-smi는 RBLN NPU 장치의 실시간 모니터링 및 관리를 위한 주요 도구입니다. 장치 정보 (하드웨어, PCI 토폴로지), 성능 메트릭 (전력, 온도, 활용도), 프로세스 추적, RSD 그룹을 통한 리소스 관리 기능을 제공합니다. 사람이 읽을 수 있는 테이블, JSON, CSV 등 다양한 출력 형식을 지원합니다.


성능 및 검증

rblnBandwidthLatencyTest는 호스트 및 장치 메모리 간 데이터 전송 성능을 측정하며, 대역폭 (H2D, D2D, D2H) 및 지연 시간 테스트를 제공합니다. 시스템 검증, 성능 벤치마킹, 토폴로지 검증에 유용합니다.


rblnvs (RBLN Validation Suite)는 GRUB 파라미터, BIOS 설정 (IOMMU, SR-IOV, PCIe, NUMA), BMC를 통한 팬 속도 모니터링 등 시스템 구성을 검증합니다.

제한 사항

BIOS 설정 검증 및 팬 속도 모니터링은 Redfish API를 통한 BMC 액세스가 필요하며, 현재 DCMS 라이센스가 있는 Supermicro 서버에서만 지원됩니다.


펌웨어 업데이트

rbln-flash는 RBLN 장치의 CP 및 MCU 펌웨어 업데이트를 관리합니다. 여러 장치에 대한 병렬 업데이트를 지원하며 장치별 상태 추적 기능을 제공합니다. 작업 전 드라이버 언로드가 필요합니다.


시스템 서비스

RSMD (Rebellions System Management Daemon)는 gRPC API를 통해 중앙화된 장치 관리를 제공하는 백그라운드 서비스입니다. 데몬은 netlink를 통해 커널 이벤트를 모니터링하고, 장치 텔레메트리 (온도, 전력, 메모리, 사용률)를 수집하며, 이벤트 이력을 CSV 로그로 유지합니다. 대화형 장치 관리를 위한 rbln-smdi CLI 도구와 자동 시작을 위한 rbln_daemon systemd 서비스를 포함합니다.