Конспект
Кожне твердження у питанні можна зрозуміти як властивість еліпсів. Тільки властивість зокрема до двовимірного нормального розподілу , який необхідний той факт , що в стандартному двовимірне нормальний розподіл --Для якого Х і Y є некоррелірованнимі - умовна дисперсія Y не залежить від X . (Це в свою чергу є безпосереднім наслідком того, що відсутність кореляції передбачає незалежність для спільно нормальних змінних.)Х, YХYYХ
Наступний аналіз точно показує, яка властивість еліпсів задіяний, і отримує всі рівняння питання, використовуючи елементарні ідеї та найпростішу можливу арифметику, таким чином, щоб їх легко запам'ятати.
Кругові симетричні розподіли
Поширення питання є членом сімейства двовимірних нормальних розподілів. Всі вони походять від основного члена, стандартного двовимірного нормального, який описує два некорельованих стандартних нормальних розподіли (утворюючи дві його координати).
Ліва сторона - рельєфна ділянка стандартної двовимірної нормальної щільності. Права сторона показує те саме в псевдо-3D, передня частина відрізана.
Це приклад кругового симетричного розподілу: щільність змінюється в залежності від відстані від центральної точки, але не в напрямку від цієї точки. Таким чином, контури її графіка (праворуч) є кола.
Більшість інших двовимірних нормальних розподілів не є круговими симетричними, однак: їх перерізи є еліпсами. Ці еліпси моделюють характерну форму багатьох біваріантних точкових хмар.
Це портрети двовимірного нормального розподілу з коваріаційною матрицею Це модель для даних з коефіцієнтом кореляції-2/3.Σ = ( 1- 23- 231) .- 2 / 3
Як створити еліпси
Еліпс - за його найдавнішим визначенням - це конічний переріз, який є колом, спотвореним проекцією на іншу площину. Розглядаючи характер проекції, як це роблять візуальні художники, ми можемо розкласти його на послідовність спотворень, які легко зрозуміти та обчислити.
Спочатку розтягніть (або, якщо потрібно, стисніть) коло вздовж того, що стане довгою віссю еліпса, поки він не стане правильної довжини:
Далі стисніть (або розтягніть) цей еліпс уздовж його другорядної осі:
По-третє, оберніть його навколо центру в остаточну орієнтацію:
Нарешті, перемістіть його в потрібне місце:
Це все афінні перетворення. (Насправді перші три - це лінійні перетворення ; остаточний зсув робить його афінним.) Оскільки композиція афінних перетворень (за визначенням) ще афінна, чисте спотворення від кола до кінцевого еліпса є афінним перетворенням. Але це може бути дещо складним:
Зверніть увагу на те, що сталося з (природними) осями еліпса: після того, як вони були створені зсувом і стисканням, вони (звичайно) обертаються і зміщуються разом із самою віссю. Ми легко бачимо ці осі навіть тоді, коли вони не намальовані, оскільки вони є осями симетрії самого еліпса.
Ми хотіли б застосувати наше розуміння еліпсів для розуміння спотворених кругових симетричних розподілів, як биваріантна нормальна сім'я. На жаль, існує проблема із цими спотвореннями : вони не поважають різницю між осями та y . Обертання на кроці 3 руйнує це. Подивіться на слабкі координатні сітки у фонах: вони показують, що відбувається з сіткою (з сітки 1 /ху1 / 2в обох напрямках) при спотворенні. На першому зображенні проміжок між початковими вертикальними лініями (показаний суцільним) подвоюється. У другому зображенні відстань між початковими горизонтальними лініями (показано пунктирними) скорочується на третину. На третьому зображенні проміжки сітки не змінені, але всі лінії обертаються. Вони зміщуються вгору і вправо на четвертому зображенні. Підсумкове зображення, показуючи чистий результат, відображає цю натягнуту, стиснуту, обертову, зміщену сітку. Початкові суцільні прямі координати більше не є вертикальними.х
Ідея ключа --one може ризикне сказати , що це суть регресії - це те , що є спосіб , в якому коло може бути спотворений в еліпс без повороту вертикальних ліній . Оскільки винуватцем був обертання, давайте вирішимо переслідувати та покажемо, як створити обертається еліпс, насправді не з’являючись, щоб щось обертати !
Це перетворення косого. Це насправді робить дві речі одночасно:
Він стискається у напрямку (на суму λ , скажімо). Це залишає х-ось у спокої.уλx
Він піднімає будь-яку отриману точку на величину, прямо пропорційну x . Записавши цю константу пропорційності як ρ , це посилає ( x , y ) до ( x , y + ρ x ) .(x,y)xρ(x,y)(x,y+ρx)
Другий крок піднімає вісь у пряму y = ρ x , показану на попередньому малюнку. Як показано на цій фігурі, я хочу працювати з особливим перекосом перекосу, яке ефективно обертає еліпс на 45 градусів і вписує його в одиничний квадрат. Головною віссю цього еліпса є пряма y = x . Візуально видно, що | ρ | ≤ 1 . (Негативні значення ρ нахиляють еліпс вправо, а не вправо.) xy=ρxy=x|ρ|≤1ρ Це геометричне пояснення "регресу до середнього".
Вибір кута 45 градусів робить еліпс симетричним навколо діагоналі квадрата (частина прямої ). Щоб визначити параметри цієї перекосової трансформації, дотримуйтесь:y=x
Підняття на переміщує точку ( 1 , 0 ) до ( 1 , ρ ) .ρx(1,0)(1,ρ)
Симетрія навколо основної діагоналі тоді передбачає, що точка також лежить на еліпсі.(ρ,1)
З чого почався цей момент?
Початкова (верхня) точка одиничного кола (маючи неявне рівняння ) з x координатою ρ була ( ρ , √x2+y2=1xρ.(ρ,1−ρ2−−−−−√)
Будь-яку точку форми спочатку стискають до ( ρ , λ y ), а потім піднімають до ( ρ , λ y + ρ × ρ ) .(ρ,y)(ρ,λy)(ρ,λy+ρ×ρ)
Унікальне рішення рівняння єλ= √(ρ,λ1−ρ2−−−−−√+ρ2)=(ρ,1) . Це сума, на яку повинні бути стиснуті всі відстані у вертикальному напрямку, щоб створити еліпс під кутом 45 градусів, коли він перекошений вертикально наρ.λ=1−ρ2−−−−−√ρ
ρ0, 3/10, 6/10,9/10,
ρ
Застосування
Ми готові до регресії. Стандартний, елегантний (але простий) метод регресії спочатку виражає оригінальні змінні в нових одиницях вимірювання: ми центруємо їх за допомогою їх засобів і використовуємо їх стандартні відхилення як одиниці. Це переміщує центр розподілу до початку і робить усі його еліптичні контури нахиленими на 45 градусів (вгору або вниз).
x0x0y1−ρ2−−−−−√ρxρxx
xy=ρx : лінія найменших квадратів збігається з лінією регресії.
x координат.
Ми можемо легко сказати більше:
1x1−ρ2
ρΣXYXYXY(X,Y)
ε=Y−ρX
ε0Y0ρXρX
xρ=−1/2
Отже
E(XY)=E(X(ρX+ε))=ρE(X2)+E(Xε)=ρ(1)+0=ρ.
X1XεX(−ε)ε0
ρXY
Висновки
x(X,Y)xyμxμyσxσy
(μx,μy)
{(x,ρx)},
ρσyρ/σx
Отже, рівняння лінії регресії є
y=σyρσx(x−μx)+μy.
- Y|Xσ2y(1−ρ2)Y′|X′(X′,Y′)X′=(X−μX)/σxY′=(Y−μY)/σY
Y′|X′1
- Σσ11=σ2x, σ12=σ21=ρσxσy,σ22=σ2y,Y|X
σ2y(1−ρ2)=σ22(1−(σ12σ11σ22−−−−−√)2)=σ22−σ212σ11.
Технічні примітки
y
(1ρρ1)=AA′
де
A=(1ρ01−ρ2−−−−−√).
Набагато більш відомий квадратний корінь - той, який був описаний спочатку (передбачає обертання замість перекосу перекосу); це той, що утворюється в результаті розкладання сингулярного значення, і він відіграє помітну роль в аналізі основних компонентів (PCA):
(1ρρ1)=BB′;
B=Q(ρ+1−−−−√001−ρ−−−−√)Q′
Q=⎛⎝12√12√−12√12√⎞⎠45
Таким чином, відмінність між PCA і регресією зводиться до різниці двох спеціальних квадратних коренів кореляційної матриці.