Як довести, що


9

Я намагався встановити нерівність

|Ti|=|XiX¯|Sn1n

де середнє значення вибірки і стандартне відхилення вибірки, тобто .X¯SS=i=1n(XiX¯)2n1

Неважко помітити, що і так але це не дуже близько до того, що я шукав, і не є корисним пов'язаним. Я експериментував з нерівностями Коші-Шварца і трикутниками, але нікуди не дійшов. Повинно бути тонкий крок, який я десь пропускаю. Буду вдячний за допомогу, дякую.i=1nTi2=n1|Ti|<n1

Відповіді:


10

Це нерівність Самуельсона, і йому потрібен знак . Якщо взяти версію Вікіпедії та переробити її для визначення ви виявите, що вона стаєn1S,

|XiX¯|Sn1n

Це подано як сувора нерівність у книзі, але я це виправив, дякую.
ДжонК

5

Після спрощення проблеми за допомогою рутинних процедур її можна вирішити, перетворивши її в програму подвійного мінімізації, яка має добре відому відповідь з елементарним доказом. Можливо, ця дуалізація - це "тонкий крок", про який йдеться у питанні. Нерівність також може бути встановлена ​​суто механічним шляхом, максимізуючичерез множники Лагранжа.|Ti|

По-перше, я пропоную більш елегантне рішення, засноване на геометрії найменших квадратів. Це не вимагає попереднього спрощення і є майже негайним, забезпечуючи пряму інтуїцію результату. Як запропоновано в питанні, проблема зводиться до нерівності Коші-Шварца.


Геометричне рішення

Розглянемо як -вимірний вектор в евклідовому просторі зі звичайним точковим добутком. Нехай стати базисний вектор і . Запишіть та для ортогональних проекцій та в ортогональний додаток . (У статистичній термінології вони є залишками щодо засобів.) Тоді, оскільки іx=(X1,X2,,Xn)ny=(0,0,,0,1,0,,0)ith1=(1,1,,1)x^y^xy1XiX¯=x^yS=||x^||/n1 ,

|Ti|=n1|x^y|||x^||=n1|x^y^|||x^||

- компонент у напрямку . За Коші-Шварцем максимально точно, коли паралельний , для яких QED.y^x^x^y^=(1,1,,1,n1,1,1,,1)/n

Ti=±n1y^y^||y^||=±n1||y^||=±n1n,

Між іншим, це рішення забезпечує вичерпну характеристику всіх випадків, колиє максимальним: вони всі форми|Ti|

x=σy^+μ1=σ(1,1,,1,n1,1,1,,1)+μ(1,1,,1)

для всіх справжніх .μ,σ

Цей аналіз легко узагальнюється у випадку, коли замінюється будь-яким набором регресорів. Очевидно, що максимум пропорційний довжині залишків ,.{1}Tiy||y^||


Спрощення

Оскільки є інваріантним при зміні місця розташування та масштабу, ми можемо без втрати загальності вважати, що дорівнює нулю, а їхні квадрати - . Це ідентифікуєз, оскільки (середній квадрат) дорівнює . Максимізація його рівнозначна максимальному . Жодна загальність не втрачається, приймаючи , оскільки є обмінними.TiXin1|Ti||Xi|S1|Ti|2=Ti2=Xi2i=1Xi


Розчин за допомогою подвійної рецептури

Подвійна проблема полягає у фіксації значення і запитання, які значення решти потрібні для мінімізації суми квадратів враховуючи, що . Оскільки задано , це проблема мінімізації враховуючи, що .X12Xj,j1j=1nXj2j=1nXj=0X1j=2nXj2j=2nXj=X1

Рішення легко знайти багатьма способами. Одне з найелементарніших - писати

Xj=X1n1+εj, j=2,3,,n

для якого . Розширення цільової функції та використання цієї ідентичності сума-нуль для її спрощення виробляєj=2nεj=0

j=2nXj2=j=2n(X1n1+εj)2=(X1n1)22X1n1εj+εj2=Constant+εj2,

негайно показавши унікальне рішення - для всіх . Для цього рішенняεj=0j

(n1)S2=X12+(n1)(X1n1)2=(1+1n1)X12=nn1X12

і

|Ti|=|X1|S=|X1|n(n1)2X12=n1n,

QED .


Рішення за допомогою машини

Повернення до спрощеної програми ми почали з:

Maximize X12

на тему

i=1nXi=0 and i=1nXi2(n1)=0.

Метод множників Лагранжа (який майже чисто механічний і прямолінійний) прирівнює нетривіальну лінійну комбінацію градієнтів цих трьох функцій до нуля:

(0,0,,0)=λ1D(X12)+λ2D(i=1nXi)+λ3D(i=1nXi2(n1)).

Компонент за складовою, ці рівняння єn

0=2λ1X1+λ2+2λ3X10=λ2+2λ3X20=0=λ2+2λ3Xn.

Останній з них означає або або . (Ми можемо виключити останній випадок, тому що тоді перше рівняння передбачає , тривіалізуючи лінійну комбінацію.) Обмеження суми до нуля виробляє . Обмеження суми квадратів забезпечує два рішенняn1X2=X3==Xn=λ2/(2λ3)λ2=λ3=0λ1=0X1=(n1)X2

X1=±n1n; X2=X3==Xn=1n.

Вони обоє поступаються

|Ti|=|X1||±n1n|=n1n.

Дякую за ваш додаток, геометрія дуже потужна, і з усіх трьох рішень вона для мене найбільш інтуїтивна.
ДжонК

0

Зазначена нерівність є правдою. Цілком зрозуміло інтуїтивно, що ми отримуємо найскладніший випадок нерівності (тобто максимізацію лівої сторони гана для даного ), вибравши одне значення, скажімо, якомога більше, при цьому всі інші рівні. Розглянемо приклад з такою конфігурацією:S2x1

n=4,x1=x2=x3=0,x4=4,x¯=1,S2=4,
тепер залежно від , тоді як дана верхня межа дорівнює що справедливо достатньо. Цю ідею можна доповнити доказом.|xix¯|S={12 or 32i412=1.5

EDIT

Зараз ми доведемо твердження, як натякано вище. По-перше, для будь-якого заданого вектора у цій задачі ми можемо замінити його на не змінюючи жодної сторони нерівності вище. Отже, у наступному припустимо, що . Ми також можемо, повторно позначаючи, припустити, що є найбільшим. Тоді, вибравши спочатку а потім ми можемо за допомогою простої алгебри перевірити, що ми маємо рівність у заявленій нерівності. Отже, це різко.x=(x1,x2,,xn)xx¯x¯=0x1x1>0x2=x3==xn=x1n1

Потім визначте (опуклу) область по для заданої позитивної константи . Зауважимо, що є перетином гіперплану із сферою, центрованою біля початку, так само сферою у -просторі. Тепер наша проблема може бути сформульована як починаючи зR

R={xR:x¯=0,(xix¯)2/(n1)S2}
S2R(n1)
maxxRmaxi|xi|
xмаксимізація, що буде найскладнішим для нерівності. Це проблема пошуку максимуму опуклої функції над опуклим набором, що в цілому є складними проблемами (мінімуми - це просто!). Але в цьому випадку опукла область - це сфера, орієнтована на початок, і функція, яку ми хочемо максимізувати, - це абсолютне значення координат. Очевидно, що цей максимум знайдений у прикордонній сфері та, приймаючимаксимум, наш перший тестовий випадок вимушений.R|x1|

@JohnK Ви можете видалити свої коментарі зараз, публікація виправлена
kjetil b halvorsen

Хоча ця відповідь показує, що нерівність (якщо припустити, що це правда, якою вона є) є тісною , не очевидно, яким чином цей єдиний розрахунок може бути "завершений до доказу". Не могли б ви вказати, як це зробити?
whuber

Буде, але завтра, тепер я повинен підготувати завтрашній клас.
kjetil b halvorsen

Дякую - я вдячний за вашу ретельну постановку проблеми. Але ваш «доказ», схоже, приходить до твердження, що «це очевидно». Ви завжди можете застосувати множники Lagrange, щоб закінчити роботу, але було б непогано бачити підхід, який (а) насправді є доказом і (b) забезпечує розуміння.
whuber

2
@whuber Якщо у вас є час, я буду вдячний, якщо ви зможете опублікувати своє рішення для множників Lagrange. Я думаю, що загальна нерівність не така відома, як повинна бути.
ДжонК
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.