По-новому моделювання даних з експериментальної рамки даних проектування.
З акцентом на R (хоча інше мовне рішення було б чудово).
Розробляючи експеримент або опитування, моделювання даних та проведення аналізу цих модельованих даних може забезпечити надзвичайне уявлення про переваги та недоліки конструкції.
Такий підхід також може бути важливим для розуміння та правильного використання статистичних тестів.
Однак цей процес має тенденцію дещо втомлювати, і багато хто змушений пропустити цей важливий крок в експерименті чи опитуванні.
Статистичні моделі та тест містять більшу частину інформації, необхідної для моделювання даних (включаючи припущення або явне твердження про розподіл).
Враховуючи модель аналізу (та пов'язані з нею припущення, наприклад, нормальність та збалансованість), рівні фактора та міри значущості (наприклад, p-значення), я хотів би отримати модельовані дані (в ідеалі з узагальненою функцією, подібною до друкувати (), передбачати (), імітувати ()).
Чи можливий такий узагальнений фреймворк моделювання?
Якщо так, то чи існує така структура на даний момент?
Наприклад, я хотів би функцію, таку як:
sim(aov(response~factor1+factor2*factor3),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
тобто узагальнена версія:
sim.lm<-function(){
library(DoE.base)
design<-fac.design(nlevels=c(10,3,3),
factor.names=c("factor1", "factor2", "factor3"),
replications=3,
randomize=F)
response<-with(design, as.numeric(factor1)+
as.numeric(factor2)+
as.numeric(factor3)+
as.numeric(factor2)*as.numeric(factor3)+
rnorm(length(factor1)))
simulation<-data.frame(design, response)}
АБО
sim(glm(response~factor1+factor2*factor3, family=poisson),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
АБО
library(lme4)
sim(lmer(response~factor1+factor2 + (factor2|factor3)),
F_value=list(factor1=50,
factor2=50),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
це створило б повний відповідний data.frame
потенційні приклади конкретних функцій (будь ласка, редагуйте за бажанням)
- arima.sim
функція існує для створення фрейму даних рівнів факторів без модельованої відповіді:
напр. conf.design
http://cran.r-project.org/web/views/ExperimentalDesign.html