驱动装好了 但是使用vllm的benchmark 报错

[复制链接]
15 2

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
[19:56:27.286][MXC][E]MxcInit: mxkwOpenMXCD() return fail!
[19:56:27.287][MCR][E]mx_device.cpp            :1418: mxc init failed
[19:56:27.287][MCR][E]mc_runtime_api.cpp       :226 : 44131: [7effae7ae180] mcGetDeviceCount: Returned mcErrorInitializationError
ERROR 05-12 19:56:27 worker_base.py:549] Error executing method init_device. This might cause deadlock in distributed execution.
ERROR 05-12 19:56:27 worker_base.py:549] Traceback (most recent call last):
ERROR 05-12 19:56:27 worker_base.py:549]   File "/opt/conda/lib/python3.10/site-packages/vllm/worker/worker_base.py", line 541, in execute_method
ERROR 05-12 19:56:27 worker_base.py:549]     return executor(*args, **kwargs)
ERROR 05-12 19:56:27 worker_base.py:549]   File "/opt/conda/lib/python3.10/site-packages/vllm/worker/worker.py", line 139, in init_device
ERROR 05-12 19:56:27 worker_base.py:549]     torch.cuda.set_device(self.device)
ERROR 05-12 19:56:27 worker_base.py:549]   File "/opt/conda/lib/python3.10/site-packages/torch/cuda/__init__.py", line 412, in set_device
ERROR 05-12 19:56:27 worker_base.py:549]     torch._C._cuda_setDevice(device)
ERROR 05-12 19:56:27 worker_base.py:549]   File "/opt/conda/lib/python3.10/site-packages/torch/cuda/__init__.py", line 306, in _lazy_init
ERROR 05-12 19:56:27 worker_base.py:549]     torch._C._cuda_init()
ERROR 05-12 19:56:27 worker_base.py:549] RuntimeError: CUDA driver initialization failed, you might not have a CUDA gpu.



使用mx-smi能查到 显卡信息  请问下 这个是什么原因

mx-smi  version: 2.2.3

=================== MetaX System Management Interface Log ===================
Timestamp                                         : Mon May 12 19:58:09 2025

Attached GPUs                                     : 1
+---------------------------------------------------------------------------------+
| MX-SMI 2.2.3                        Kernel Mode Driver Version: 2.14.6          |
| MACA Version: unknown               BIOS Version: 1.24.3.0                      |
|------------------------------------+---------------------+----------------------+
| GPU         NAME                   | Bus-id              | GPU-Util             |
| Temp        Pwr:Usage/Cap          | Memory-Usage        |                      |
|====================================+=====================+======================|
| 0           MetaX C500             | 0000:d8:00.0        | 0%                   |
| 55C         41W / 350W             | 858/65536 MiB       |                      |
+------------------------------------+---------------------+----------------------+

+---------------------------------------------------------------------------------+
| Process:                                                                        |
|  GPU                    PID         Process Name                 GPU Memory     |
|                                                                  Usage(MiB)     |
|=================================================================================|
|  no process found                                                               |
+---------------------------------------------------------------------------------+



精彩评论2

xshen  注册会员  发表于 3 天前 | 显示全部楼层
可能是权限没有配置好,请参考我们发布的文档配置权限,例如使用root或者把用户加入video用户组。
 楼主| lanaya1234  新手上路  发表于 3 天前 | 显示全部楼层
xshen 发表于 2025-5-13 14:03
可能是权限没有配置好,请参考我们发布的文档配置权限,例如使用root或者把用户加入video用户组。 ...

多谢   已解决
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

©沐曦 沪ICP备2020031767号-1
快速回复 返回顶部 返回列表