Зв'язок між дисперсією та попарними відстанями в межах змінної


20

Будь ласка, доведіть, що якщо у нас є дві змінні (однаковий розмір вибірки) і і дисперсія в більша, ніж у , то сума квадратних різниць (тобто квадратних евклідових відстаней) між точками даних у межах також більша, ніж що в .XYXYXY


1
Будь ласка, уточніть: коли ви говорите дисперсію , ви маєте на увазі відмінність вибірки ? Коли ви говорите суму різниць у квадраті , ви маєте на увазі ? i,j(xixj)2
кардинал

9
Припустимо вищесказане: ретельно враховуючи елементи в перехресній перспективі. Я думаю, ви можете заповнити (невеликі прогалини). Потім результат тривіально випливає.
i,j(xixj)2=ij((xix¯)(xjx¯))2=2ni=1n(xix¯)2,
кардинал

2
Існує також спосіб зробити це "без" будь-яких обчислень, враховуючи той факт, що якщо і є iid від (з чітко визначеною дисперсією), то . Однак це потребує дещо більш чіткого розуміння ймовірних концепцій. X1X2FE(X1X2)2=2Var(X1)
кардинал

1
Для відповідного запитання я використав візуалізацію того, що тут відбувається у відповіді на stats.stackexchange.com/a/18200 : різниці у квадраті - це області квадратів.
whuber

1
@whuber: Дуже приємно. Я якось пропустив цю вашу відповідь по дорозі.
кардинал

Відповіді:


5

Просто надати "офіційну" відповідь, доповнити рішення, замальовані в коментарях, повідомлення

  1. Жоден з , Var ( ( Y i ) ) , i , j ( X i - X j ) 2 або i , j ( Y i - Y j ) 2 не змінюється зміщенням усіх X i рівномірно до X i - μ для деякої постійної μ або зміщення всього YVar((Xi))Var((Yi))i,j(XiXj)2i,j(YiYj)2XiXiμμ до Y i - ν для деякої постійної ν . Таким чиномми можемо припустититакі зрушення були виконаніщоб зробити Е X я = Е Y я = 0 , звідки Var ( ( X я ) ) = Σ X 2 я і Var ( ( Y я ) ) = Е Y 2 я .YiYiννXi=Yi=0Var((Xi))=Xi2Var((Yi))=Yi2

  2. Після очищення загальних факторів з кожної сторони та використання (1) питання задає питання про те, що означає i , j ( X i - X j ) 2i , j ( Y i - Y j ) 2 .Xi2Yi2i,j(XiXj)2i,j(YiYj)2

  3. Просте розширення квадратів і перестановка сум дають з аналогічним результатом для Y 's.

    i,j(XiXj)2=2Xi22(Xi)(Xj)=2Xi2=2Var((Xi))
    Y

Доказ негайний.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.