Мій непараметричний текст, Практична непараметрична статистика , часто дає чіткі формули для очікувань, дисперсій, тестових статистичних даних тощо, але включає застереження, що це працює лише в тому випадку, якщо ми ігноруємо зв'язки. Розраховуючи статистику Манна-Вітні U, рекомендується викинути зв'язані пари при порівнянні, яка більша.
Я розумію, що зв’язки насправді не говорять нам про те, яка чисельність населення більша (якщо це те, що нас цікавить), оскільки жодна група не є більшою за іншу, але, здається, це не мало б значення при розробці асимптотичних розподілів.
Чому тоді в таких непараметричних процедурах виникають такі труднощі, що стосуються зв’язків? Чи існує спосіб отримання будь-якої корисної інформації з зв’язків, а не просто їх викидання?
EDIT: Що стосується коментаря @ whuber, я знову перевірив свої джерела, і в деяких процедурах використовується середнє значення рангів замість того, щоб повністю скинути прив'язані значення. Хоча це видається більш розумним у відношенні збереження інформації, мені також здається, що їй не вистачає суворості. Дух питання все ще стоїть.