Чи є статистичний тест для порівняння двох зразків розміром 1 і 3?


19

Для екологічного проекту моя лабораторна група додала оцту до 4-х резервуарів, що містять рівний об'єм води в ставку, 1 контроль без елодеї (водної рослини) та 3 обробки з однаковою кількістю елодеї в кожному. Метою додавання оцту було зниження рН. Гіпотеза полягала в тому, що цистерни з елодеєю швидше повернуться до нормального рН. Це справді було так. Ми вимірювали рН кожного резервуару щодня протягом приблизно двох тижнів. Зрештою, всі цистерни повернулися до свого природного рН, але час, який це зайняло, був значно меншим для цистерн з елодеєю.

Коли ми розповіли нашому професору про нашу експериментальну розробку, він сказав, що не існує статистичного тесту, який може бути проведений за даними, щоб порівняти контроль з лікуванням. Тому що не було репліки для контролю (ми використовували лише один контрольний резервуар), ми не можемо обчислити дисперсію, і тому ми не можемо порівняти вибіркові засоби контролю та обробки. Тож моє запитання: чи це правда? Я точно розумію, що він означає. Наприклад, якщо ви взяли зріст одного чоловіка та однієї жінки, ви не можете зробити висновки щодо відповідних груп населення. Але ми провели 3 процедури, і дисперсія була невеликою. Здається розумним припустити, що дисперсія була б подібною в контролі?

Оновлення:

Дякую за відмінну відповідь. Ми отримали більше води та елодеї з заболочених земель і вирішили повторити експеримент з меншими цистернами, але на цей раз з 5 контролями та 5 обробками. Ми збиралися поєднати це з нашими вихідними даними, але вихідний рН резервуарів був досить різним, що не здається правильним вважати новий експеримент відбору з тієї ж сукупності, що і оригінальний експеримент.

Ми розглядали можливість додавання різної кількості елодеї та намагалися співвіднести швидкість відновлення рН (вимірюється як час, що минув, поки рН не повернувся до початкового значення) із кількістю елодеї, але вирішили, що це не потрібно. Наша мета полягає лише в тому, щоб показати, що елодея робить позитивне значення, а не побудувати якусь прогностичну модель для того, як саме рН реагує на різні кількості елодеї. Було б цікаво визначити оптимальну кількість елодеї, але це, мабуть, лише максимальна кількість, яка може вижити. Спроба приєднати криву регресії до даних не була б особливо яскравою через різні складні зміни, які трапляються в громаді при додаванні великої кількості. Елодея вмирає, розкладається, нові організми починають переважати тощо.


4
Ви додали однакову кількість Елодеї до кожного з 3-х резервуарів для лікування?
gung - Відновіть Моніку

2
Так, ми додавали однакову кількість Елодеї до кожного лікування.
Саймон Хант

Відповіді:


21

Зверніть увагу на питання Гунга; це важливо. Я припускаю, що лікування було однаковим для кожного резервуару в групі лікування.

Якщо ви можете стверджувати, що дисперсія була б однаковою для двох груп (що ви, як правило, припускаєте для двох зразків t-тесту), ви можете зробити тест. Ви просто не можете перевірити це припущення, незалежно від того, наскільки воно сильно порушено.

Занепокоєння, висловлені в цій відповіді на пов'язане питання, ще більше стосуються вашої ситуації, але ви можете з цим зробити менше.

[Ви запитуєте про розумність вважати, що відхилення рівні. Ми не можемо відповісти, що це для вас, що вам доведеться переконати, фахівці з теми (тобто екологи), було розумним припущенням. Чи є інші дослідження, де такі рівні вимірювались як під час лікування, так і під контролем? Інші, де були зроблені подібні тести ( t-тести або особливо anova - я думаю, ви можете знайти кращий прецедент) або зроблені подібні припущення? Якусь форму загальних міркувань ви можете застосувати?]

Якщо - середнє значення вибірки обробки та - середнє значення контролю, і обидва - від звичайних розподілів із відхиленням , то матиме значення та дисперсію незалежно від того, чи є один із 1.ˉ y σ2 ˉ x - ˉ y μx-μyσ2(1/nx+1/ny)nx¯y¯σ2х¯-у¯мкх-мкуσ2(1/нх+1/ну)н

Отже, коли дорівнює 1,ну

(х¯-у¯)сх1/нх+1

(де - стандартне відхилення, обчислене від лікування), буде розподілено (з ступінь свободи) під нулем. t n x - 1схтнх-1

Ви можете помітити , що з всієї наявної оцінкою , використовуються для , це так само , як звичайна два-зразка Т-тест з формулою набором до 1.s x s p n yσсхсpну

Редагувати:

Ось модельована крива потужності для цього тесту. Розмір вибірки при нулі становив 10000, в інших точках - 1000. Як бачите, коефіцієнт відхилення при нулі становить 0,05, а крива потужності, хоча це вимагає великої різниці в чисельності населення, означає мати гідну потужність, правильної форми. Тобто цей тест робить те, що йому належить.

крива потужності

(Закінчити редагування)

Однак, оскільки розміри вибірки настільки малі, це буде дещо чутливим до припущень щодо розподілу.

Якщо ви готові робити різні припущення або хочете перевірити рівність якоїсь іншої кількості популяції, деякий тест може все-таки бути можливим.

Отже, все не втрачено ... але там, де це можливо, загалом краще мати хоч якусь реплікацію в обох групах.


1
Зауважте, вам потрібно буде дотримуватися викладених формул @Glen_b. І Excel, і Minitab цього не будуть обчислювати.
zbicyclist

10
(+1) Еквівалентний підхід (використовуючи ту саму формулу) - і, отже, більше боєприпасів для обгрунтування цієї відповіді - полягає в тому, що ви можете обчислити інтервал прогнозування одного майбутнього значення з групи лікування. Якщо контрольне значення не потрапляє в цей інтервал передбачення, ви маєте вагомі докази різниці між двома групами. Різниця може бути деякою комбінацією різниці середніх чи різницею у відхиленнях, але є (ймовірно) різниця.
whuber

3
σ(х¯-12)сх1/нхт

2
@Glen_b: Не впевнений, чи це змінилося в листопаді минулого року, але R 3.0 зробить об'єднаний t-тест, коли один із розмірів вибірки - один, і дасть таку ж відповідь, як і anova.
Аарон - Відновити Моніку

2
Для тих, хто хоче спробувати його в R: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - схоже, це працює і в R2.15.2, і в R3.0.0 (єдині дві версії, які я маю у пригоді).
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.