Нерівність оракул: в базовому виразі


15

Я переглядаю документ, який використовує нерівність оракул, щоб довести щось, але я не в змозі зрозуміти, що він навіть намагається зробити. Коли я шукав в Інтернеті про "нерівність Oracle", деякі джерела направили мене до статті "Candes, Emmanuel J." Сучасна статистична оцінка через нерівності оракул ". "які можна знайти тут https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf . Але ця книга здається мені занадто важкою, і я вважаю, що мені бракує певних передумов.

Моє запитання: Як би ви пояснили, що таке нерівність оракула для не-математичного мажора (включає інженерів)? По-друге, як би ви рекомендували їм розглянути передумови / теми, перш ніж намагатися дізнатися щось подібне до вищезгаданої книги.

Я настійно рекомендую, щоб хтось, хто має конкретне розуміння та великий досвід досвіду статистики високих розмірів, повинен відповісти на це.


2
Чи може хтось із репутацією більше 1 тис., Будь ласка, запропонуйте щедро за це питання. Це справді допомогло б. Я не думаю, що загальні користувачі резюме були б знайомі з цією концепцією, оскільки більшість користувачів використовують статистику для аналізу даних, а не теоретичного аналізу, хоча, як спільнота, повністю заснована на статистиці, я вважаю, що повинен бути хтось, хто міг би адекватно відповісти на це. Я вважаю, що питання не приділяв належної уваги.
Wolcott

1
Я думав над тим же питанням
jeza

"Визначення", наведене на с.22 посилання "Нерівність оракула пов'язує ефективність реального оцінювача з характеристикою ідеального оцінювача, який спирається на досконалу інформацію, що надається оракулом, і яка недоступна на практиці". Чи це не передає вам суті визначення?
Марк Л. Стоун

2
@Mark L. Stone для мене, це не так
jeza

1
Навіть не дивлячись на приклад та обговорення, наведені в попередніх кількох реченнях, тобто твердження та обговорення теореми 4.1, як приклад нерівності оракул? Простіше кажучи: «Боже, ми не знаємо оптимального значення (наданого оракулом) коефіцієнта усадки, який ми повинні використовувати. Але знаючи, що оптимальне значення коефіцієнта усадки може покращити МСЕ не більше ніж на 2 проти, не маючи оптимального коефіцієнта усадки від оракула.
Марк Л. Стоун

Відповіді:


9

Спробую пояснити це в лінійному випадку. Розглянемо лінійну модель Коли (кількість незалежних змінних менше або дорівнює кількості спостережень) і матриця проектування має повний ранг, оцінювач найменшого квадрата є та помилка передбачення - з якого ми можемо вивести Це означає, що кожен параметр оцінюється з точністю у квадратіОтже, ваша загальна точність у квадраті

Yi=j=1pβjXi(j)+ϵi,i=1,...,n.
pnb
b^=(XTX)1XTY
X(b^β0)22σ2
EX(b^β0)22n=σ2np.
βj0σ2/n,j=1,...,p.(σ2/n)p.

А що робити, якщо кількість спостережень менша за кількість незалежних змінних ? Ми «віримо», що не всі наші незалежні змінні грають роль у поясненні , тому лише деякі, скажімо, , з них є ненульовими. Якби ми знали, які змінні є ненульовими, ми могли б нехтувати усіма іншими змінними, і за вищенаведеним аргументом загальна точність у квадраті складе(p>n)Yk(σ2/n)k.

Оскільки набір ненульових змінних невідомий, нам потрібна певна санкція регуляризації (наприклад, ) з параметром регуляризації (який контролює кількість змінних). Тепер ви хочете отримати результати, аналогічні розглянутим вище, ви хочете оцінити точність квадрата. Проблема в тому, що ваш оптимальний оцінювач тепер залежить від . Але великий факт полягає в тому, що при правильному виборі для ви можете отримати верхню межу помилки передбачення з високою ймовірністю, тобто "нерівність оракул" Зверніть увагу на додатковий коефіцієнтl1λβ^λλ

X(β^β0)22nconst.σ2logpnk.
logp, яка є ціною за незнання набору ненульових змінних. " " залежать лише від або .const.pn

Строго кажучи, нам не потрібно, щоб кількість спостережень була меншою за кількість незалежних змінних, щоб усі наступні частини були правильними.
jbowman

Чи можете ви пояснити, як отримали рівняння очікування (друге до останнього рівняння) та нерівність (останнє рівняння)?
user13985

X(b^β0)22σ2 має розподіл chi-квадрата з p ступенями свободи, тому його очікування становить . Остання нерівність - це нерівність оракул. Доказ не такий тривіальний, я можу порекомендувати цю книгу: Статистика (σ2/n)p
Дато
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.