版本：下一个

Grafana Dashboard

HAMi 提供预构建的 Grafana Dashboard，用于可视化 HAMi 设备插件导出的 GPU 分配、显存使用和每 Pod 利用率指标。

导入 Dashboard

Dashboard 包含以下面板：

每个节点上的 hami-device-plugin Pod 在端口 31992（可通过 devicePlugin.monitorPort 配置）上暴露指标。添加采集任务：

scrape_configs:
  - job_name: hami-device-plugin
    static_configs:
      - targets:
          - <node-ip>:31992

对于 Prometheus Operator，创建一个 ServiceMonitor，指向 hami-device-plugin 服务的 31992 端口。

关键指标：

指标	说明
`Device_memory_desc_of_container`	分配给容器的虚拟 GPU 显存
`Device_utilization_desc_of_container`	每容器的 GPU 算力利用率
`Device_memory_limit_of_container`	为容器设置的显存限制