Я оцінював sample
функцію в R і порівнював її з igraph:sample_seq
і стикався з дивним результатом.
Коли я запускаю щось на кшталт:
library(microbenchmark)
library(igraph)
set.seed(1234)
N <- 55^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
Я отримую такий результат:
Unit: microseconds
expr min lq mean median uq max neval
v1 21551.475 22655.996 26966.22166 23748.2555 28340.974 47566.237 50
v2 32.873 37.952 82.85238 81.7675 96.141 358.277 50
Але коли я бігаю, наприклад,
set.seed(1234)
N <- 100^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
Я отримую набагато швидший результат для sample
:
Unit: microseconds
expr min lq mean median uq max neval
v1 52.165 55.636 64.70412 58.2395 78.636 88.120 50
v2 39.174 43.504 62.09600 53.5715 73.253 176.419 50
Здається, що коли N
потужність 10 (чи якесь інше спеціальне число?) sample
Набагато швидше, ніж інші менші N
, які не мають сили 10. Це очікувана поведінка чи мені щось не вистачає?