Кому вірити: тест Колмогорова-Смірнова або сюжет QQ?


16

Я намагаюся визначити, чи відповідає мій набір даних безперервних даних за розподілом гами з параметрами форма 1,7 та швидкість = 0,000063.==

Проблема полягає в тому, що коли я використовую R для створення графіку QQ мого набору даних проти теоретичної гамми розподілу (1,7, 0,000063), я отримую графік, який показує, що емпіричні дані приблизно узгоджуються з розподілом гами. Те саме відбувається з сюжетом ECDF.x

Однак, коли я запускаю тест Колмогорова-Смірнова, це дає мені невиправдано малу -значення .p<1%

Якому мені вибрати, щоб вірити? Графічний вихід або результат KS-тесту?

QQplot та сюжет ECDF


чи можете ви також надати отримані ділянки розподілу щільності?
Скретч

13
Тест та діагностичний графік не суперечать. Розподіл подібний до теоретичного, як показує графік QQ. Розмір вибірки досить великий, що ви, мабуть, зможете назбирати навіть невеликі відмінності від теоретичного.
Glen_b -Встановити Моніку

Відповіді:


18

Я не бачу сенсу в тому, щоб не «повірити» QQ-сюжету (якщо ви його правильно виробили); це просто графічне зображення реальності ваших даних, що поєднується з визначеним розподілом. Зрозуміло, що це не ідеальна відповідність, але якщо це досить добре для ваших цілей, це може бути більш-менш кінцем історії. Ви можете перевірити це пов'язане питання: чи тестування на нормальність "по суті марно"?

p

Чи занадто ваші дані занадто відрізняються від гамма-розподілу за вашими цільовими цілями - інше питання. Сам тест KS не може відповісти на нього (тому що його результат залежатиме від розміру вибірки, серед інших причин), але графік QQ може допомогти вам визначитися. Ви також можете розглянути надійні альтернативи будь-яким іншим аналізам, які ви плануєте запустити, і якщо ви особливо серйозно ставитеся до чутливості будь-яких наступних аналізів до відхилень від розподілу гами, ви можете також подумати про те, щоб зробити тестування з імітацією .


15

Що ви можете зробити, це створити кілька зразків з вашого теоретичного розподілу та побудувати їх на тлі вашого QQ-сюжету. Це дасть вам уявлення про те, якої мінливості можна з розумом очікувати від простої вибірки.

Ви можете розширити цю ідею, щоб створити конверт навколо теоретичної лінії, використовуючи приклад зі сторінок 86-89 із:

Venables, WN and Ripley, BD 2002. Сучасна прикладна статистика з S. New York: Springer.

Це буде конвертний конверт. Ви можете продовжити цю ідею ще більше, щоб створити загальний конверт, використовуючи ідеї зі сторінок 151-154 із:

Девісон, AC та Хінклі, DV 1997. Методи завантаження та їх застосування. Кембридж: Кембриджський університетський прес.

Однак для базового дослідження я думаю, що просто побудувати пару еталонних зразків на фоні вашого QQ-сюжету буде більш ніж достатньо.


Гарна ідея! Нагадуйте мені підняти це за 11 годин (використали всі мої голоси за мультфільми ) ... Мені особливо подобається завантажувати ECDF як спосіб збагачення такого роду сюжетом.
Нік Стаунер

1
Також подивіться на пакет CRAN sfsmisc, який має функцію ecdf.ksCI, малюючи довіру на графіку ecdf. Цю ж ідею можна було б використати, щоб намалювати довіру на сюжеті QQ ...
kjetil b halvorsen

2

Тест KS передбачає конкретні параметри вашого розподілу. Він перевіряє гіпотезу "дані поширюються відповідно до цього конкретного розподілу". Можливо, ви десь вказали ці параметри. Якщо ні, то, можливо, були використані деякі невідповідні налаштування. Зауважте, що тест на KS стане консервативним, якщо оцінені параметри будуть включені в гіпотезу.

Однак більшість тестів на корисність застосовуються неправильно. Якщо тест на KS не показав би значущості, це не означає, що модель, яку ви хотіли довести, є відповідною. Ось що сказав @Nick Stauner про занадто малий розмір вибірки. Це питання схоже на тестові тести на гіпотези та тести на еквівалентність.

Отже, врешті-решт: розглядайте лише QQ-графіки.


-1

Сюжет QQ - це дослідницька методика аналізу даних, і її слід розглядати як таку - як і всі інші сюжети EDA. Вони призначені лише для того, щоб дати вам попереднє уявлення про дані, що знаходяться. Ніколи не слід вирішувати чи зупиняти аналіз на основі сюжетів EDA, таких як графік QQ. Неправильна порада розглядати лише сюжети QQ. Ви обов'язково повинні пройти кількісні методи, такі як KS Test. Припустимо, у вас є інший графік QQ для подібного набору даних, як би ви порівняли ці два без кількісного інструменту? Наступним кроком для вас, після тестування EDA та KS, з’ясується, чому тест KS дає низьке значення p (у вашому випадку це може бути навіть через певну помилку).

Методи EDA НЕ призначені слугувати інструментами прийняття рішень. Насправді я б сказав, що навіть інфекційна статистика має на увазі лише розвідувальну. Вони дають вам вказівки щодо того, в якому напрямку має здійснюватися ваш статистичний аналіз. Наприклад, t-тест на вибірці дасть вам лише рівень впевненості, що вибірка може (або не може) належати населенню, ви все одно можете продовжити далі, базуючись на тому розумінні, до якого розподілу належать ваші дані та до чого Насправді, коли хтось стверджує, що навіть методи, що реалізуються як частина машинного навчання бібліотеки, також мають розвідувальний характер !!! Я сподіваюся, що вони означають це в цьому сенсі ...!

Прийняття статистичних рішень на основі сюжетів чи методів візуалізації означає знущання над досягненнями статистичної науки. Якщо ви запитаєте мене, ви повинні використовувати ці сюжети як інструменти для повідомлення остаточних висновків на основі вашого кількісного статистичного аналізу.


Це забороняє мені робити щось, що я роблю часто, і вважаю розумним, приймати рішення, задавши дослідницький сюжет і зупинятися перед більш офіційним тестом на значимість. Жодних знущань не спричинено. Це повторюваний та догматичний коментар, який не додає нічого корисного до існуючих відмінних та набагато більш нюансованих відповідей. Порівнювати сюжети QQ дуже просто ...
Нік Кокс

Я не читав інших відповідей, але якщо вони також заохочують кількісні методи, я добре. На поставлене запитання я дав свою відповідь. Але мені цікаво, що не потрібно багато часу, щоб зробити офіційні квантові тести (ще кілька хвилин, щоб зробити тест на KS) з доступними зараз пакетами на зразок R, то чому б хто-небудь зупинявся на сюжетах EDA? Одразу після перевірки результатів тесту KS на R із завантажувальним завантаженням я помітив у кількох місцях, де це було зазначено як небажане використання тощо. Це пов’язано із загальною підозрою щодо традиційних методів статистики? Це є обґрунтуванням моїх сильних коментарів ... щоб не ображати жодного
Murugesan Narayanaswamy

Ви дійсно повинні прочитати інші відповіді перед публікацією. Наслідком публікації є те, що у вас є щось різне (а також захисне). Ваш коментар викликає спантеличення тим, що сюжети QQ не є "кількісними методами". Діаграма QQ в принципі показує всю кількісну інформацію, що має значення для оцінки відповідності розподілу. На відміну від такого тесту, як Колмогоров-Смірнов, дає одновимірне скорочення і мало допомагає, що робити далі.
Нік Кокс

Діаграма QQ порівнює теоретичний розподіл з даними тестових даних і забезпечує візуальне подання, але тест KS робить те ж саме набагато більш жорстким способом, використовуючи статистичні поняття і дає нарешті значення ймовірності. Ви не можете порівняти два графіки QQ, але ви отримаєте кількісну різницю при використанні тесту KS. Неправильно, що р-значення тесту KS невірно. Неправильно також, що емпіричний набір даних не може використовуватися для отримання параметрів розподілу. Я особисто робив завантаження і перевіряв значення p за допомогою обох таблиць і розраховував розподіл коломогрів вручну.
Murugesan Narayanaswamy

У вашому коментарі є багато тіньового боксу, хто сперечається, де ви не можете використовувати емпіричні дані для отримання оцінок параметрів? Це те, з чим ми всі повинні погодитися, робиться тут. Вам доведеться пробачити мене за те, що не хочуть вести дискусію. Я стою проти своєї реакції на вашу відповідь.
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.