Моє запитання коротко: чи існують методи покращити час роботи R MICE (внесення даних)?
Я працюю з набором даних (30 змінних, 1,3 мільйона рядків), який містить (цілком випадково) відсутні дані. Близько 8% спостережень у приблизно 15 із 30 змінних містять НС. Для того щоб імпулювати відсутні дані, я виконую функцію MICE, що є частиною пакету MICE .
Я відчуваю досить повільний час роботи, навіть на підмножині (100 000 рядків), з методом = "fastpmm" і m = 1 і триває близько 15 хвилин.
Чи є спосіб покращити час роботи, не втрачаючи занадто багато продуктивності? (mice.impute.mean досить швидкий, але приходить з важливою втратою інформації!).
Код, що відтворюється:
library(mice)
df <- data.frame(replicate(30,sample(c(NA,1:10),1000000,rep=TRUE)))
df <- data.frame(scale(df))
output <- mice(df, m=1, method = "fastpmm")