NVIDIA-SMI вийшов з ладу, оскільки не міг спілкуватися з драйвером NVIDIA. Переконайтеся, що встановлено та працює останній драйвер NVIDIA


23

Щойно я встановив CUDA в такий ноутбук:

sudo apt-get install cuda

Як сказано тут .

Компіляція wokrs просто чудова, але коли я намагаюся запустити, у мене виникла наступна проблема: CUDA помилка у file.cu:128 код = 35 (cudaErrorInsufficientDriver) "cudaStreamCreate (& (stream [i]))"

Моя версія nvcc:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Інформація про відеокарту:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Я також встановив VirtualGL, джмелі-nvidia, primus, freeglut3-dev. Слідом за цим .

Коли я намагаюся запустити щось на джмелі, я отримав таке: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

драйвер nvidia не працює.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Схоже, встановлена ​​версія nvidia 375, але я не можу змусити її працювати.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

І деякі відомості про водія.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Я думаю, це може бути якась проблема версії драйвера:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Що я пропускаю?


як встановити драйвери?
Чарлі Паркер

Зіткнувся з тією ж помилкою, і жодна з відповідей не спрацювала. Що ж робота була простою: $ reboot now.
darthbhyrava

Відповіді:


14

Якщо вам nvidia-smiне вдалося зв’язатися, але ви встановили драйвер стільки разів, перевірте prime-select.

  1. Запустіть, prime-select queryщоб отримати всі можливі варіанти. Ви повинні принаймні побачити nvidia | intel.
  2. Виберіть prime-select nvidia.
  3. Якщо він каже nvidia is already selected, виберіть інший, наприклад prime-select intel, а потім поверніться до nvidiaprime-select nvidia
  4. Перезавантажте та перевірте nvidia-smi.

Допомогли мені. Спасибі!
Ярослав Шуберт

ой, prime-select queryнавіть не перерахував інтел, я думаю, у мене зараз 2 проблеми ...
Inspi

11

Ви можете встановити інструментарій cuda. Використовуючи наступну команду для її встановлення.

sudo apt install nvidia-cuda-toolkit

Після того, як установка завершена, перезавантажте машину. nvidia-smiповинні працювати.


працює для мене !!
x0v

Це працює для мене
Sundeep,

6
Тут не вийшло
Білл Коціас

2
не робіть цього, якщо у вас cuda> = 10. Це знизить ваш cuda до 9, що доступно в даний час на ubuntu без CUDA PPA.
loretoparisi

Виступаючи sudo apt-get purge nvidia-*раніше, тоді вищевказаний рядок виправляв усе, що стосується CUDA, для мене встановив драйвер 430 із CUDA 10.1
Dinari

6

Я відключив безпечну завантаження, і вона спрацювала досить добре.

@ rod-smith відповів на ще одне питання, яке конкретніше пояснює, як це зробити, в основному це конфігурація налаштування, але він також написав гарну статтю про те, як це зробити тут .


2
Це допомогло мені також з драйвером nvidia 390! Я ніколи не думав, що це може бути через безпечне завантаження, thx :)
samutamm

Режим UEFI із захищеним завантаженням desabled тут вже виконаний. =) Схоже, це працює не для всіх, на жаль.
Ренан Вілліан Прадо

3

оскільки я не можу коментувати відповідь @ Родольфо вище (недостатньо репутації), я додаю нову відповідь.

На своїй машині мені довелося налаштувати Secure Boot відповідно до моєї ОС. У мене на материнській платі ASUS працює Ubuntu 18.04 і спробував встановити NVIDIA CUDA 10.1 Update 2 з упакованим драйвером NVIDIA. Я зіткнувся з тим же питанням, яке описано вище. Як виявилося, захищене завантаження було встановлено в режимі Windows UEFI. Змінивши його на Іншу ОС, виправили це для мене.


1
Дякую, мені довелося вимкнути, Secure Bootяке було автоматично ввімкнено під час автоматичного оновлення Windows / BIOS !!! Зараз nvidia прекрасно працює.
Білл Коціас

Ви б не хотіли пояснити, як ви змінили захищений завантажувач на Іншу ОС ?
Інспі

1
@BillKotsias дякую! : D
Марек

0

Для майбутніх читачів:

Я перебуваю на екземплярі віртуальної машини (Google Cloud Platform)

і я слідкую за цією суттю, щоб встановити Cudaі CuDNnна своєму VM.

Мені довелося завантажувати CuDNnчастину вручну . (Просто виставляючи його там.)

Тепер, перейшовши до помилки:

У мене виникло це питання, але повний перезапуск екземпляра зробив цю роботу. І під повним перезапуском я маю на увазі зупинку примірника та його повторне ввімкнення.

Я сподіваюся, що це комусь допоможе.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.