Я спостерігаю значні прискорення передачі даних, коли використовую закріплену пам’ять для передачі даних CUDA. У Linux основним системним викликом для досягнення цього є mlock. На сторінці користувача mlock зазначено, що блокування сторінки не дозволяє її замінити:
mlock () блокує сторінки в діапазоні адрес, починаючи з addr і продовжуючи довгий байт. Усі сторінки, які містять частину зазначеного діапазону адрес, гарантовано залишатимуться в оперативній пам'яті, коли дзвінок успішно повернеться;
У моїх тестах у мене було кілька концертів вільної пам'яті в моїй системі, тому ніколи не було ризику того, що сторінки пам'яті могли бути замінені, але я все ще спостерігав пришвидшення. Хто-небудь може пояснити, що насправді тут відбувається?, Будь-яка інформація та інформація дуже цінуються.