Я запускаю симуляцію на R та кластер комп’ютерів і маю наступну проблему. На кожному з X комп’ютерів я запускаю:
fxT2 <- function(i) runif(10)
nessay <- 100
c(mclapply(1:nessay, fxT2), recursive=TRUE)
Є 32 комп’ютери, кожен з яких має 16 ядер. Однак приблизно 2% випадкових чисел однакові. Які стратегії ви б прийняли, щоб уникнути цього?
Мені вдалося уникнути цієї проблеми для fxT2, встановивши затримку (тобто затримуючи на секунду час, на який кожне завдання надсилається на кожен з комп'ютерів X). Але це здається дуже спеціальним для fxt2.
Проблема полягає в тому, що насправді fxT2 - це довге завдання, що включає псевдовипадкові числа. В кінці процесу я очікую отримати X * nessay відтворення того ж статистичного експерименту, а не репродукції nessay. Як переконатися, що це дійсно так, і чи є спосіб це перевірити?