Ось простий приклад іграшки, що ілюструє ефект розмірності в проблемі дискримінації, наприклад, проблема, з якою ви стикаєтесь, коли хочете сказати, якщо щось спостерігається, або якщо спостерігається лише випадковий ефект (ця проблема є класичною в науці).
Евристичний. Основне питання тут полягає в тому, що евклідова норма надає однакове значення будь-якому напрямку. Це означає відсутність попереднього, і, як ви, звичайно, знаєте, у високому вимірі немає безкоштовного обіду (тобто, якщо ви не маєте попереднього уявлення про те, що шукаєте, то немає жодної причини, чому якийсь шум не буде схожий на те, що ви є шукає, це тавтологія ...).
Я б сказав, що для будь-якої проблеми існує межа інформації, яка необхідна, щоб знайти щось інше, ніж шум. Ця межа якось пов'язана з "розміром" області, яку ви намагаєтесь дослідити, щодо рівня "шуму" (тобто рівня неінформативного змісту).
Якщо у вас є високий розмір, якщо ваш сигнал попередній, що ваш сигнал є рідким, ви можете видалити (тобто штрафувати) нерозріджений вектор з метрикою, яка заповнює простір з розрідженим вектором або за допомогою методики визначення порогових знаків.
Рамка Припустимо, що - гауссовий вектор із середнім та діагональною коваріацією ( відомий) і що ви хочете перевірити просту гіпотезуξνσIdσ
H0:ν=0,VsHθ:ν=θ
(для заданого ) не обов'язково відомо заздалегідь.
θ∈Rnθ
Тест-статистика на енергію . Інтуїція у вас, безумовно, полягає в тому, що це гарна ідея оцінити норму / енергію з вас спостереження для складання тестової статистики. Насправді ви можете побудувати стандартизовану по центру (під ) версію енергії . Це робить критичну область на рівні форми для добре обраногоEn=1n∑ni=1ξ2iξH0TnTn=∑iξ2i−σ22nσ4√α{Tn≥v1−α}v1−α
Потужність тесту та розмірність. У цьому випадку легка ймовірність вправи показати наступну формулу сили вашого тесту:
Pθ(T≤v1−α)=P⎛⎝⎜Z≤v1−α1+2∥θ∥22/(nσ2)−−−−−−−−−−−−−√−∥θ∥222nσ4+2σ2∥θ∥22/(nσ2)−−−−−−−−−−−−−−−−−−√⎞⎠⎟
з сума iid випадкових величин з і .ZnE[Z]=0Var(Z)=1
Це означає, що потужність вашого тесту збільшується на енергію вашого сигналу і зменшується на . На практиці це означає, що коли ви збільшуєте розмір своєї проблеми, якщо вона одночасно не збільшує силу сигналу, то ви додаєте до спостереження неінформативну інформацію (або ви зменшуєте частку корисної інформації в інформації у вас є): це як додавання шуму і зменшення потужності тесту (тобто, швидше за все, ви скажете, що нічого не спостерігається, поки щось є насправді).∥θ∥22nn
До тесту з пороговою статистикою. Якщо ви не маєте багато енергії в своєму сигналі, але якщо ви знаєте лінійну трансформацію, яка може допомогти вам зосередити цю енергію на невеликій частині сигналу, ви можете побудувати тестову статистику, яка буде оцінювати лише енергію для малих частина вашого сигналу. Якщо ви заздалегідь знаєте, де він сконцентрований (наприклад, ви знали, що у вашому сигналі не може бути високих частот), то ви можете отримати потужність у попередньому тесті з заміненою на невелику кількість, і майже те саме ... Якщо ви не знаєте цього заздалегідь, ви повинні його оцінити, це призводить до добре відомих порогових тестів.n∥θ∥22
Зауважте, що цей аргумент лежить в корені багатьох робіт, таких як
- А Антоніадіс, Ф Абрамович, Т Сапатінас і Б Видадакович. Вайлеткові методи тестування у функціональному аналізі дисперсійних моделей. Міжнародний журнал про вейвлетах та його додатках, 93: 1007–1021, 2004.
- М. В. Бурнашеф та Бегматов. Про проблему виявлення сигналу, що призводить до стабільного розподілу. Теорія ймовірності та її застосування, 35 (3): 556–560, 1990.
- Ю. Баро. Неасимптотична мінімальна швидкість тестування при виявленні сигналу. Бернуллі, 8: 577–606, 2002.
- J Вентилятор. Перевірка значущості на основі вейвлетного порогу та укорочення Неймана. JASA, 91: 674–688, 1996.
- Дж. Фан і СК Лін. Перевірка значущості, коли дані є кривими. JASA, 93: 1007–1021, 1998.
- В. Спокойни. Тестування адаптаційної гіпотези за допомогою вейвлетів. Анали статистики, 24 (6): 2477–2498, грудень 1996 р.