Повідомлення про ступінь свободи для тесту Welch


14

Т-тест Велча на неоднакові дисперсії (також відомий як Велч-Саттерватвайт або Велч-Аспін), як правило, має не цілі ступені ступеня свободи . Як слід цитувати ці ступені свободи при повідомленні про результати тесту?

"Зазвичай, округляючи до найближчого цілого числа, перш ніж звертатися до стандартних таблиць t", відповідно до різних джерел * - це має сенс, оскільки цей напрямок округлення є консервативним. ** Деяке старе статистичне програмне забезпечення теж зробило б це (наприклад, Graphpad Prism перед версією 6 ) і деякі онлайн-калькулятори все ще роблять. Якщо ця процедура була використана, звітність про округлені ступені свободи видається доцільною. (Хоча використання кращого програмного забезпечення може бути навіть більш доречним!)

Але переважна більшість сучасних пакетів використовує дробову частину, тому в цьому випадку здається, що дробову частину слід цитувати. Я не можу вважати за доцільне цитувати більше двох знаків після коми, оскільки тисячна частина свободи мала б лише незначний вплив на значення p .

Оглядаючи науковця Google, я можу побачити документи, в яких цитується df як ціле число, з одним десятковим чи двома знаками після коми. Чи є вказівки щодо точності використання? Крім того , якщо програмне забезпечення використовується повною дрібна частина, якщо цитований ДФ округлюються вниз до потрібної кількості цифр (наприклад до 1 дп або як ціле число) , як це було доречний з консервативний розрахунок, або як мені здається більш розумним, округлюється умовно ( до найближчого ) так, що до 1 dp або до найближчого цілого?77.5845...7.5787.5845...7.68

Редагувати: окрім знання теоретично найбільш обґрунтованого способу звітування про не ціле число df, було б також добре знати, що люди роблять на практиці . Імовірно, що журнали та посібники зі стилів мають свої вимоги. Мені було б цікаво, чого вимагають такі впливові посібники, як APA. З того, що я можу розрізнити (їх посібник не є у вільному доступі в Інтернеті), APA має загальну перевагу, що майже все повинно з’являтися до двох знаків після коми, крім p -значень (які можуть бути два-три dp) та відсотків (округлених до найближчий відсоток) - що охоплює нахили регресії, t статистику, статистику F ,χ2статистика тощо. Це досить нелогічно, маючи на увазі, що друге десяткове місце займає зовсім іншу значущу цифру, і передбачає зовсім іншу точність у 2,47, ніж у 982,47, але це може пояснити кількість df Welch з двома десятковими знаками, які я бачив у своєму ненауковому зразку .

напр., Рукстон, Дж. Д. Нерівномірний тест на дисперсію є недостатньо використаною альтернативою t-тесту Стьюдента та тесту Манна – Уітні, U , поведінкова екологія (липень / серпень 2006 р.) 17 (4): 688-690 дої: 10.1093 / beheco / ark016

Хоча саме наближення Велч-Саттерватвайта може бути або не бути консервативним, а у випадку, коли воно не є консервативним, округлення ступенів свободи не є гарантією компенсації загальної суми.


1
Я не вивчав фактичної практики - саме тому це коментар, а не відповідь, - але я б очікував, що вона базуватиметься на судженнях, пов’язаних із повідомленням про важливі цифри. Для відносно високого df часто зміна першого десяткового знака взагалі не змінить значення р (до рівня точності, про який повідомляється), тому округлення до цілого числа є нормальним. Для дуже низьких df та екстремальних значень похіднаможе перевищувати , що дозволяє в таких випадках повідомляти про лише одну менш значущу цифру, ніж сам . t | νt0,01νс|νFν(t)|0.01νp
whuber

@whuber Це дійсно корисне спостереження, особливо якщо взяти його разом із відповіддю Glen_b. Наскільки низький "дуже низький" для ? (Моя підозра на зразок паперів, на які я натрапила, полягає в тому, що багато "фактичної практики" може бути не те саме, що "хороша практика"! Я підозрюю, що робототехнічне дотримання інструкцій має стільки ж ефекту, як і судження, тому було б цікаво щоб знати, що таке загальні рекомендації щодо звітування.)ν
Срібна рибка

Відповіді:


10

Я не вивчав фактичної практики, тому ця відповідь не може вирішити цей аспект питання. Як загальний принцип, я б очікував, що обробка значущих цифр у повідомленні про ступінь свободи (df) має базуватися на судженнях, пов'язаних зі значущими цифрами.

Принцип повинен бути послідовним : використовуйте точність в одній кількості, що відповідає точності, що використовується в іншій, яка пов'язана з нею. Зокрема, при повідомленні значень і коли надається найближчому кратному малому значенню (наприклад, для шести місць після десяткової крапки) відносна точність у , опосередкована функцією єy = f ( x ) x h h = 1xy=f(x)xhyfh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

Наближення застосовується, коли неперервно диференціюється на проміжку .[ x - h , x + h ]f[xh,x+h]

У цій заявці - -значення, - ступеня свободи , іp x νypxν

y=f(x)=f(ν)=Fν(t)

де є статистика Welch-Satterthwaite і є CDF Студентського розподілу з ступенів свободи.F ν t νtFνtν

Для відносно високого df часто зміна першого десяткового знаку взагалі не змінить значення р (до рівня точності, про який повідомляється), тому округлення до цілого числа є нормальним ( але дуже мало). Для дуже низьких df та екстремальних значень статистики величина похідноїможе перевищувати , пропонуючи в таких випадках, що потрібно повідомляти лише про один менший десятковий знак, ніж сам .ч = 1 / 2 ч | гνh=1/2т| h|ddxf(x)|t0,01νс|νFν(t)|0.01νp

Побачте самі з цим міченим контурним графіком величину похідної для найменших (розумних) df та діапазонівце було б цікаво (оскільки вони можуть призвести до низьких значень р).|t|

Малюнок

На етикетках зображено логарифм похідної основи-10. Таким чином, у точках між та на цій графіці зміна повідомленого df у місці після десяткової коми, ймовірно, змінить повідомлене p-значення лише у та пізніші місця. Наприклад, припустимо, що ви округляєте значення р до (шість знаків після коми). Розглянемо статистику і . Вони розташовані поблизу контуру лога. Тому слід повідомляти про знаки після коми.k(k+1)jth(j+k)th106ν=2.5t=83ν6+(3)=3

Світло-сині області, для найбільших , викликають занепокоєння, оскільки вони показують, де невеликі зміни мають найбільший вплив на p-значення.kν

Порівнюйте це із ситуацією для більш високого df (від до показано):430

Малюнок 2

Вплив на точність швидко зменшується, оскільки зростає.νpν


1
Це було дуже корисним внеском для того, щоб визначити, за якими принципами потрібно округлити ступінь свободи (+50!); Я сподіваюсь, що пізніше відповідь зможе заповнити прогалини щодо фактичної практики.
Срібляста рибка

7

Зазвичай округляти до найближчого цілого числа перед тим, як звернутися до стандартних таблиць t

Причина, що була умовою, полягає в тому, що таблиці не мають нецілого df. Немає підстав робити це інакше.

що має сенс, оскільки це коригування є консервативним.

Що ж, статистика насправді не має t-розподілу, тому що в знаменнику квадрата насправді немає розподіленого чи-квадратного розподілу. Це наближення, яке може бути або не бути консервативним у певному конкретному випадку - округлення df вниз може бути непевним консервативним, коли ми розглядаємо точний розподіл статистики в конкретному екземплярі.

(за допомогою інтерполяції або насправді розчавлення чисел для t-розподілу з цим df?)

p-значення від t-розподілів (застосовуючи cdf до t-статистики) можна обчислити різними досить точними наближеннями, тому вони ефективно розраховуються, а не інтерполюються.

Я не можу бачити доречне цитування більш ніж двох знаків після коми

Я згоден.

Чи є вказівки щодо точності використання?

Однією з можливостей може бути дослідження того, наскільки точне наближення Велча-Саттертвейта для р-значення в цій загальній області коефіцієнтів дисперсії, а не цитувати істотно більшу точність, ніж це могло б запропонувати в df (маючи на увазі, що df на chi-квадрат у знаменнику квадрата просто дає наближення до чогось, що так чи інакше не є chi-kvadrat).


1
Я повинен був уточнити, що "округлення вниз консервативне". Сам наближення Вельча-Саттерватвайта може бути, а може і не бути консервативним. Але процес округлення вниз, безумовно, є - якщо наближення не було консервативним для початку, це, принаймні, менш погано після округлення вниз. На відміну від цього, округлення (наприклад, "7,5845 раундів, найближчих до 8"), безумовно, не є консервативним коригуванням. Я міг би знайти кращий спосіб сформулювати це, але сподіваюся, моя суть зрозуміла!
Срібна рибка

"Однією з можливостей може бути дослідження того, наскільки точне наближення Велча-Саттерватвайта до р-значення в цій загальній області коефіцієнтів дисперсії" - це дуже розумно і, здається, є принциповим підходом. Це щось звичайно робиться? Деякі натяки на реалізацію було б непогано. На практиці я підозрюю, що вказівки щодо стилю журналу часто мають остаточну думку з цього приводу! Але я не знаю, що вони говорять - напевно, в документах, на які я шукав, була певна практика.
Срібна рибка

Щоб спробувати уникнути плутанини з майбутніми читачами, я намагався уточнити повторне консервативне округлення в тілі запитань. Дякуємо, що зібрали це.
Срібна рибка

Я не думаю, що щось подібне зазвичай робиться, але я не думаю, що це означає, що цього не повинно бути. Скільки пояснень, чому один раунд / скорочення до певного моменту потрапляє в документ, очевидно, залежатиме від журналу / редактора / арбітрів.
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.