Я хочу підходити до змішаної моделі, використовуючи lme4, nlme, байзійський регресійний пакет або будь-який доступний.
Змішана модель у конвенціях про кодування Asreml-R
Перш ніж розібратися у конкретних характеристиках, ми можемо захотіти деталізувати конвенції asreml-R для тих, хто не знайомий з кодами ASREML.
y = Xτ + Zu + e ........................(1) ;
звичайна змішана модель з, y позначає вектор n × 1 спостережень, де τ - р × 1 векторних ефектів, X - матриця n × p проектування повного рангового стовпця, яка пов'язує спостереження з відповідною комбінацією вивірених ефектів , u - вектор q × 1 випадкових ефектів, Z - матриця проектування n × q, яка пов'язує спостереження з відповідною комбінацією випадкових ефектів, а e - вектор n × 1 залишкових помилок. Модель (1) називається лінійна змішана модель або лінійна змішана модель ефектів. Передбачається
де матриці G і R - функції параметрів γ і φ відповідно.
Параметр θ - параметр дисперсії, який ми будемо називати параметром масштабу.
У змішаних моделях ефектів з більш ніж однією залишковою дисперсією, що виникає, наприклад, при аналізі даних з більш ніж одним розділом або змінною, параметр θ присвоюється одному. У змішаних моделях ефектів з однією залишковою дисперсією тоді θ дорівнює залишкової дисперсії (σ2). У цьому випадку R повинна бути кореляційною матрицею. Більш детальна інформація про моделі наведена в посібнику Asreml (посилання) .
Варіаційні структури для помилок: R структура та структури дисперсій для випадкових ефектів: G структури можуть бути задані.
дисперсійне моделювання в асремі () важливо зрозуміти формування дисперсійних структур за допомогою прямих добутків. Звичайне припущення про найменші квадрати (і за замовчуванням в asreml ()) - це те, що вони розподілені незалежно та однаково (IID). Однак, якщо дані були з польового експерименту, викладеного у прямокутному масиві r рядків c стовпцями, скажімо, ми могли б упорядкувати залишки e як матрицю і потенційно вважати, що вони автокорельовані у рядках та стовпцях. Записуючи залишки як вектор у польовому порядку, тобто шляхом сортування рядків залишків у стовпцях (графіки в межах блоків), тоді може бути дисперсія залишків
є кореляційними матрицями для рядкової моделі (порядок r, параметр автокореляції ½r) та моделі стовпців (порядок c, параметр автокореляції ½c) відповідно. Більш конкретно, іноді передбачається двовимірна відокремлена авторегресивна просторова структура (AR1 x AR1) для поширених помилок в польовому дослідному аналізі.
Приклад даних:
nin89 походить з бібліотеки asreml-R, де різні типи вирощувались у реплікаціях / блоках у прямокутному полі. Для управління додатковою мінливістю у напрямку рядків чи стовпців кожен графік посилається на змінні рядків та стовпців (конструкція стовпців рядків). Таким чином, цей рядок стовпця оформляють з блокуванням. Вихід вимірюється змінним.
Приклад моделей
Мені потрібно щось еквівалентне кодам asreml-R:
Синтаксис простої моделі виглядатиме так:
rcb.asr <- asreml(yield ∼ Variety, random = ∼ Replicate, data = nin89)
.....model 0
Лінійна модель задається у фіксованих (обов'язкових), випадкових (необов'язкових) та rcov (компонентах помилках) аргументах об'єктів. За замовчуванням це простий термін помилки і його не потрібно формально вказувати на термін помилки, як у моделі 0 .
тут різноманітність є фіксованим ефектом і випадковим є репліками (блоками). Крім випадкових і фіксованих термінів ми можемо вказати термін помилки. За замовчуванням у цій моделі 0. Залишковий або помилковий компонент моделі задається в об'єкті формули через аргумент rcov, див. Наступні моделі 1: 4.
Наступна модель1 є більш складною, в якій задані і G (випадкова), і R (помилка) структури.
Модель 1:
data(nin89)
# Model 1: RCB analysis with G and R structure
rcb.asr <- asreml(yield ~ Variety, random = ~ idv(Replicate),
rcov = ~ idv(units), data = nin89)
Ця модель еквівалентна вищевказаній моделі 0 та вводить використання дисперсійної моделі G та R. Тут параметр random і rcov задає випадкові та rcov формули, щоб чітко вказати структури G і R. де idv () - функція спеціальної моделі в asreml (), яка ідентифікує модель дисперсії. Вираз idv (одиниці) явно встановлює матрицю дисперсії для e до масштабованої ідентичності.
# Модель 2: двовимірна просторова модель з кореляцією в одному напрямку
sp.asr <- asreml(yield ~ Variety, rcov = ~ Column:ar1(Row), data = nin89)
експериментальні одиниці nin89 індексуються стовпцем та рядком. Тож ми очікуємо випадкові зміни в двох напрямках - напрямку рядка та стовпця в цьому випадку. де ar1 () - спеціальна функція, що визначає модель авторегресивної дисперсії першого порядку для рядка. Цей виклик визначає двовимірну просторову структуру для помилок, але з просторовою кореляцією лише у напрямку рядка. Модель дисперсії для стовпця має тотожність (id ()), але її формально не потрібно вказувати, оскільки це за замовчуванням.
# модель 3: двовимірна просторова модель, структура помилок в обох напрямках
sp.asr <- asreml(yield ~ Variety, rcov = ~ ar1(Column):ar1(Row),
data = nin89)
sp.asr <- asreml(yield ~ Variety, random = ~ units,
rcov = ~ ar1(Column):ar1(Row), data = nin89)
подібно до вищезгаданої моделі 2, проте кореляція має два напрями - авторегресивний.
Я не впевнений, наскільки ці моделі можливі з пакетами з відкритим кодом R. Навіть якщо рішення будь-якої з цих моделей буде корисною. Навіть якщо виграш +50 може стимулювати розробку такого пакету, буде дуже корисно!
Див. Розділ MAYSaseen надав результати для кожної моделі та дані (як відповідь) для порівняння.
Редагування: Наступне пропозиція, яку я отримав на форумі змішаних моделей: "Ви можете подивитися на регресивні та просторові пакети коваріації Девіда Кліффорда. Перша дозволяє встановлювати (гауссові) змішані моделі, де ви можете дуже гнучко визначати структуру коваріаційної матриці. (наприклад, я використовував це для даних про родовід). Пакет просторової короваріації використовує регрес для надання більш досконалих моделей, ніж AR1xAR1, але може бути застосовно. Можливо, вам доведеться листуватися з автором щодо застосування його до вашої точної проблеми. "
corStruct
в nlme
(для анізотропних кореляцій) ... Це допоможе, якщо ви можете коротко викласти (словами чи рівняннями) статистичні моделі, відповідні цим твердженням ASREML, оскільки ми не всі знайомі з Синтаксис ASREML ...
MCMCglmm
, і я впевнений, що (крім spatialCovariance
згадали, що я НЕ знаком с), єдиним способом , щоб зробити це в R є визначенням нових corStruct
с - що можливо, але не тривіальні.
lme4
. Чи можете ви (а) сказати нам, для чого вам потрібно це зробити,lme4
а неasreml-R
(б) розглянути повідомлення про те,r-sig-mixed-models
де є більш відповідні знання?