Питання каже все це. Я читав і те, і інше не може узагальнити KS до розміру, рівного або більшого, ніж два , і що відомі такі реалізації, як у цифрових рецептах , просто неправильні. Чи можете ви поясніть, чому так?
Питання каже все це. Я читав і те, і інше не може узагальнити KS до розміру, рівного або більшого, ніж два , і що відомі такі реалізації, як у цифрових рецептах , просто неправильні. Чи можете ви поясніть, чому так?
Відповіді:
Я вважаю, що правомірним є цитування відповідної частини відповідного абзацу:
3. Тест на KS не можна застосовувати у двох чи більше вимірах. Астрономи часто мають набори даних із точками, розподіленими в площині чи більшими розмірами, а не по лінії. Кілька робіт у астрономічній літературі пропонують представити двовимірний тест KS, а один відтворений у відомому томі «Числові рецепти». Однак жодне випробування на основі EDF (це включає KS, AD та пов'язані з ним випробування) не можна застосовувати у двох чи більших розмірах, оскільки немає єдиного способу впорядкувати точки, щоб можна було обчислити відстані між чітко визначеними EDF. Можна побудувати статистику на основі якоїсь процедури впорядкування, а потім обчислити величини відстані між двома наборами даних (або одним набором даних та кривою). Але критичні значення отриманої статистики не є розподілом.
Як зазначалося, це здається занадто сильним.
1) Функція розподілу біваріантів, яка - це карта від до . Тобто, функція приймає уніваріантні реальні значення між 0 і 1. Ці значення - ймовірності - безумовно, вже «впорядковані» - і це (значення функції) - це те, що нам потрібно для порівняння для тестів на основі ECDF. . Аналогічно ecdf, ідеально чітко визначений у біваріантному випадку.
Я не думаю, що обов'язково потрібно намагатися перетворити його на якусь функцію універсальної комбінованої змінної, як підказує текст. Ви просто обчислите і при кожній необхідній комбінації та обчисліть різницю.
2) Однак у питанні, чи не розповсюджується це, у них є пункт:
а) очевидно, що така тестова статистика не буде змінена змінами трансформацій поля, тобто, якщо вона побудована як тест на біваріантні незалежні форми, , то це працює однаково добре, як тест на незалежність де . У цьому сенсі воно не має розподілу (можна сказати, "маржинальний").
b) однак, існує більш глибокий пункт, що в більш широкому розумінні є тим, що наївна версія статистики КС (така, яку я щойно описав) не є більш загальною для вільного поширення; ми не можемо просто перетворити довільно .
У попередній версії своєї відповіді я сказав:
Ніяких труднощів, жодних проблем
Це неправильно. Дійсно, існують проблеми, якщо зміниться не тільки межа від неоднорідної незалежної форми, як тільки було сказано. Однак ці труднощі були розглянуті декількома способами в ряді робіт, які дають двовимірні / багатоваріантні версії статистики Колмогорова-Смірнова, які не страждають від цієї проблеми.
Я можу повернутися і додати деякі з цих посилань та деякі дискусії про те, як вони працюють, як тільки дозволяє час.