Я щиро сподіваюся, що я сформулював це питання таким чином, що на нього можна остаточно відповісти - якщо ні, будь ласка, дайте мені знати, і я спробую ще раз! Я також мушу зазначити, що я буду використовувати R для цих аналізів.
У мене є кілька заходів , plant performance (Ys)
які я підозрюю , що під впливом чотири лікування я imposed-- flower thinning (X1), fertilization (X2), leaf clipping (X3)
, і biased flower thinning (X4)
. Для всіх можливих Y, N становить щонайменше 242, тому розміри моїх зразків були великими. Всі ділянки або піддавали проріджуванню, або ні, але кожен сюжет також піддавався одному (і лише одному) з трьох інших обробок (чи ні - також були контрольні ділянки). Ідея цієї конструкції полягала в тому, щоб перевірити, чи інші три способи лікування здатні або "маскувати", або "посилювати" наслідки стоншення. Таким чином, за задумом, три останні способи лікування (X2-X4) не могли взаємодіяти один з одним, оскільки їх не схрещували, але кожен може взаємодіяти з проріджуванням квітки - і вони, ймовірно, так роблять.
Мої явні гіпотези полягають у тому, що 1) квітуча квітка буде істотною і 2) терміни взаємодії X1*X2, X1*X3, and X1*X4,
між проріджуванням квітки та іншими трьома методами лікування також будуть значущими. Тобто стоншення квітки повинно мати значення, але способи, що мають значення, повинні суттєво змінити те, що зробили інші три обробки.
Я хочу включити всю цю інформацію у змішану модель:
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
Але є одна зависання: у мене є вагомі підстави вважати, що вплив стоншення на Y нелінійний. Вони, ймовірно, квадратичні, але, можливо, навіть кубічні в деяких випадках. Це тому, що наслідки проріджування на продуктивність, швидше за все, збільшуються при більш високих рівнях стоншування. Якщо я спробую моделювати цю нелінійну залежність за допомогою рівняння, наведеного вище, додаючи квадратичні та кубічні терміни для X1, то я не знаю, як моделювати умови взаємодії - чи повинен я включати всі можливі поєднання X1, (X1) ^ 2, і (X1) ^ 3 * X2, X3 і X4? Тому що це здається безліччю параметрів, які потрібно спробувати оцінити, навіть з урахуванням кількості точок даних, і я не знаю, як інтерпретувати отримані результати. При цьому я не маю жодних біологічних причин вважати, що це буде недоцільним способом моделювання ситуації.
Отже, у мене є три думки щодо вирішення цього питання:
- Спочатку підходимо до меншої моделі, наприклад
Y ~ X1 + X1^2 + X^3 + Random effects
, з єдиною метою з'ясувати, чи є відношення між проріджуванням та Y лінійним, квадратичним чи кубічним, а потім перетворити проріджування через квадратний або кубиковий корінь, щоб відповідним чином лінеаризувати відносини. Звідси умови взаємодії можна моделювати, як вище, з перетвореною змінною.- Припустимо, що значні взаємодії, якщо вони відбуваються, впливають лише на один із X1 термінів (тобто лише лінійний, квадратичний або кубічний термін), і моделюйте взаємодії відповідно. Я навіть не впевнений, чи має такий підхід сенс.
- Просто підходимо до "повної моделі" з усіма можливими термінами взаємодії між термінами витончення та іншими методами лікування, як обговорювалося вище. Потім обріжте незначні терміни взаємодії та використовуйте графіки та інші прийоми для інтерпретації результатів.
Який із цих підходів, якщо такий є, має найбільш сенс і чому, враховуючи, що мене цікавить тестування гіпотез, а не вибір моделі? Зокрема, якщо №1 вище не має сенсу робити, чому це так? Я прочитав цю статтю та цю статтю і спробував засвоїти, що вони можуть означати для мене, але будь-які джерела для подальшого читання також були б вдячні!