Як вектор змінних може представляти гіперплощину?


12

Я читаю Елементи статистичного навчання і на сторінці 12 (розділ 2.3) лінійну модель позначають як:

Y^=XTβ^

... де - це транспозиція вектора стовпців предикторів / незалежних змінних / входів. (Він раніше зазначав, що "всі вектори вважаються векторами стовпців", тож чи не це зробить вектором рядків і векторним стовпцем?)XTXTβ^

В включено " ", помножене на відповідний коефіцієнт, що дає (постійний) перехоплення.X1

Продовжує говорити:

У -вимірному просторі вхід-вихід, являє собою гіперплощину. Якщо константа включена в , то гіперплан включає початок і є підпростором; якщо ні, то це афінний набір, що ріже вісь в точці .(p+1)(X, Y^)XY(0, β0^)

Чи " " описує вектор, утворений конкатенацією предикторів, " " і ? І чому включення " " в змушує гіперплан проходити через початок, безумовно, що " " потрібно помножити на ?(X, Y^)1Y^1X1β0^

Я не розумію книги; будь-яка допомога / порада / посилання на ресурси будуть дуже вдячні.


4
Це може допомогти спочатку розглянути . У такому разі , з перехопленням . Це рівняння прямої, що проходить . Розширення до більш високих розмірів негайне. у = & beta ; 0 + х & beta ; & beta ; 0 ( 0 , & beta ; 0 )p=1y^=β^0+xβ^β0(0,β^0)
ocram

Якщо допомоги @ocram недостатньо, спробуйте виписати вектори і зробити множення.
Пітер Флом

2
Ось хороше графічне представлення: blog.stata.com/2011/03/03 / ... . Позначення різні, A є ваш X і x є . β^
Мастеров Димитрій Васильович

2
Книга є неправильною, або , по крайней мере , це непослідовно. Очевидно, є змінні, не включаючи постійні. Таким чином, множина справді є гіперплощиною, але неправильно сказати, що константа "включена в ". Замість цього я думаю , що книга означало сказати константа включена в регресію , але все ж не слід розглядати як частину . Тому модель справді повинна бути написана де . Встановлення негайно дає твердження про перехоплення. { ( X , Y ) | X R р } Х Х У = & beta ; 0 + Х ' & beta ; & beta ; = ( & beta ; 1 , & beta ; 2 , ... , & beta ; р ) ' Х = 0p{(X,Y^)|XRp}XXY^=β^0+Xβ^β=(β1,β2,,βp)X=0
whuber

1
(Якщо ми замість цього включимо константу в , то ми не можемо дозволити вільно змінюватися протягом усього : він обмежений лежати в розмірному підпросторі . Графік тоді кодименсія є щонайменше і тому насправді не є "гіперпланом")Х Р р р - 1 { ( Х , Y ) } 2XXRpp1{(X,Y^)}2
whuber

Відповіді:


4

Нехай - кількість спостережень, а - кількість пояснювальних змінних.КNK

NX насправді є матрицеюТільки коли ми дивимось на одне спостереження, ми позначаємо кожне спостереження як - вектор рядків пояснювальних змінних одного конкретного скалярного спостереження, помножений на вектор стовпця . Крім того, - це векторний стовпець , Що містить усі спостереження .N×KxiTK×1βYN×1Yn

Тепер, два мірна гіперплоскость розтягнеться між вектором і один (!) Вектор - стовпець . Пам'ятайте , що є матриці, так що кожна пояснює змінна представлена рівно один вектор - стовпець матриці . Якщо у нас є тільки один пояснюючі змінні, що не перехоплювати і , всі крапки даних розташовані уздовж 2 - мірної площині , натягнутої на і .YXXN×KXYYX

Для множинної регресії скільки розмірів усього має гіперплан між та матрицею ? Відповідь: Оскільки у є вектори стовпців пояснювальних змінних у , ми повинні мати розмірну гіперплан .YXKXK+1

Зазвичай у матричній регресії регресія вимагає постійного перехоплення для об'єктивного аналізу коефіцієнта нахилу. Щоб пристосувати цей трюк, ми змушуємо один стовпчик матриці складатися лише з " s". У цьому випадку оцінювач стоїть окремо, помножений на константу для кожного спостереження замість випадкової пояснювальної змінної. Коефіцієнт представляє, таким чином, очікуване значення враховуючи, що утримується фіксованим зі значенням 1, а всі інші змінні - нулем. Тому розмірна гіперплан зменшується на один розмір до -вимірного підпростору, іX1β1β1Yx1iK+1Kβ1 відповідає "перехопленню" цієї -вимірної площини.K

У налаштуваннях матриці завжди бажано ознайомитися з простим випадком двох вимірів, щоб побачити, чи зможемо ми знайти інтуїцію для наших результатів. Тут найпростіший спосіб - думати просту регресію з двома пояснювальними змінними: або альтернативно виражається в матричній алгебрі: де є матриці.

yi=β1x1i+β2x2i+ui
Y=Xβ+uXN×2

<Y,X> охоплює 3-мірну гіперплан.

Тепер, якщо ми змусимо всіх бути всіма , отримаємо: - це звичайна наша проста регресія, яка може бути представлена ​​у двовимірному графіку. Зауважимо, що тепер зводиться до двовимірної лінії - підмножини спочатку тривимірної гіперплани. Коефіцієнт відповідає перехопленню перерізу лінії при .x11

yi=β1i+β2x2i+ui
X, Y<Y,X>β1x2i=0

Далі може бути показано, що він також проходить через коли константа включена . Якщо ми залишимо постійну, гіпергресія регресії завжди проходить тривіально через - без сумніву. Це узагальнюється до декількох вимірів, як це буде видно пізніше при виведенні : Оскільки має повний ранг на визначення, , і тому регресія проходить через початок, якщо ми не залишимо перехоплення.<0,β1><0,0>βX y - X β = 0

(XX)β=Xy(XX)βXy=0X(yXβ)=0.
XyXβ=0

( Редагувати: Я щойно зрозумів, що для вашого другого питання це якраз навпаки, ви написали регулювання включення або виключення константи. Однак, я вже розробив рішення, і я виправлений, якщо я помиляюся на цьому. )

Я знаю, що матричне зображення регресії на початку може бути досить заплутаним, але з часом воно значно спрощує при виведенні більш складної алгебри. Сподіваюсь, це трохи допомагає.


1

Я думаю, що спосіб її думати - переставити це рівняння:

Y^XTβ^=0

Єдиний спосіб отримати лінійне рівняння, щоб включити початок, - це зробити передбачуване рівним перехопленню. І спосіб оцінити це значення - це включити термін перехоплення в регресійну модель.

Y^
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.