Встановіть драйвер cuda у віртуальному контейнері proxmox


3

Я встановив 2.6.32-17-pve на моїй машині з:

    02:00.0 VGA compatible controller: NVIDIA Corporation Device 11c6 (rev a1) (prog-if 00 [VGA controller])
    Subsystem: Giga-byte Technology Device 3557
    Flags: fast devsel, IRQ 16
    Memory at fa000000 (32-bit, non-prefetchable) [size=16M]
    Memory at c0000000 (64-bit, prefetchable) [size=256M]
    Memory at d0000000 (64-bit, prefetchable) [size=32M]
    I/O ports at e000 [size=128]
    Expansion ROM at fb000000 [disabled] [size=512K]
    Capabilities: [60] Power Management version 3
    Capabilities: [68] MSI: Enable- Count=1/1 Maskable- 64bit+
    Capabilities: [78] Express Endpoint, MSI 00
    Capabilities: [b4] Vendor Specific Information: Len=14 <?>
    Capabilities: [100] Virtual Channel
    Capabilities: [128] Power Budgeting <?>
    Capabilities: [600] Vendor Specific Information: ID=0001 Rev=1 Len=024 <?>
    Capabilities: [900] #19

Після створення віртуального контейнера ubuntu 12.04, я спробував встановити cuda-driver наступним чином:

  1. vzctl set 100 --pci_add 02:00.0 на хості, і lspci -v in vz print:

    02:00.0 VGA compatible controller: NVIDIA Corporation Device 11c6 (rev a1) (prog-if 00 [VGA controller])
    Subsystem: Giga-byte Technology Device 3557
    Flags: fast devsel, IRQ 16
    Memory at fa000000 (32-bit, non-prefetchable) [size=16M]
    Memory at c0000000 (64-bit, prefetchable) [size=256M]
    Memory at d0000000 (64-bit, prefetchable) [size=32M]
    I/O ports at e000 [size=128]
    Expansion ROM at fb000000 [disabled] [size=512K]
    Capabilities: <access denied>
    Kernel modules: nouveau, nvidiafb
    
  2. Я встановлюю рекомендовані пакети для встановлення cuda і змінюю версію gcc на 4.4

  3. Щоб встановити заголовок ядра pve, додаю source.list з pve: deb http://download.proxmox.com/debian squeeze pve і запустити sudo apt-get install pve-headers-2.6.32-17-pve
  4. Тепер я намагаюся встановити драйвер, але:

    ERROR: Unable to load the kernel module 'nvidia.ko'.  This happens most
    frequently when this kernel module was built against the wrong or
    improperly configured kernel sources, with a version of gcc that
    differs from the one used to build the target kernel, or if a driver
    such as rivafb, nvidiafb, or nouveau is present and prevents the
    NVIDIA kernel module from obtaining ownership of the NVIDIA graphics
    device(s), or NVIDIA GPU installed in this system is not supported
    by this NVIDIA Linux graphics driver release.
    

Я думаю, причиною може бути те, що vz не отримує права власності на графічний пристрій, але я не впевнений і не знаю, як це виправити. Чи може хто-небудь дати мені деякі пропозиції?

Дякую


Я не є користувачем, але мені здається, що проблема в клієнті - схоже, що драйвер nvidia не знайдений / завантажений ядром, який ви використовуєте - можливо, вам потрібно встановити модуль nvidia в віртуальний хост?
davidgo

Ви пробували подвійний метод, який полягає в установці драйвера nvidia в хост і потім обміну /dev/nvidia0 з гостем?
MP0

Відповіді:


1

Завантаження модулів ядра заборонено всередині контейнерів OpenVZ.

Що може work: завантажте необхідні драйвери ядра на хост, додайте доступ до будь-яких асоційованих пристроїв за допомогою --devnodes і на всяк випадок ввімкніть всі можливості, використовуючи --capability

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.