Обчислити та графік межі рішення LDA


19

Я побачив графік LDA (лінійний дискримінантний аналіз) з межею прийняття рішень з "Елементів статистичного навчання" :введіть тут опис зображення

Я розумію, що дані проектуються на нижній розмірний підпростір. Однак я хотів би знати, як ми отримуємо межі рішення у вихідному вимірі, щоб я міг проектувати межі рішення на нижній розмірний підпростір (подобається чорні лінії на зображенні вище).

Чи є формула, яку я можу використовувати для обчислення меж рішення у вихідному (вищому) вимірі? Якщо так, то для чого потрібна ця формула?


3
Замість меж прийняття рішень ви, мабуть, знайдете більше корисності при розгляді останніх ймовірностей членства в класі. Це можна зробити з меншою кількістю припущень, використовуючи політомічну (багаточленну) логістичну регресію, але також можна зробити з LDA (задні ймовірності).
Френк Харрелл

2
У межах LDA ці межі класифікації складають те, що відомо територіальною картою . Я працюю з SPSS, і це планує , хоча у текстовому форматі. За словами одного з проектувальників SPSS, межі знаходять легко за допомогою практичного підходу:
ttnphns

3
(продовження) кожна точка тонкої сітки класифікується за LDA, і якщо точка була класифікована як її сусіди, ця точка не відображається. Таким чином, зрештою залишаються лише межі як "смуги неоднозначності". Зразок цитування: they (bondaries) are never computed. The plot is drawn by classifying every character cell in it, then blanking out all those surrounded by cells classified into the same category.
ttnphns

Відповіді:


22

Ця конкретна фігура Hastie et al. був виготовлений без обчислення рівнянь меж класу. Натомість було використано алгоритм, викладений @ttnphns у коментарях, див. Виноску 2 у розділі 4.3, стор. 110:

Для цієї цифри та багатьох подібних фігур у книзі ми обчислюємо межі рішення вичерпним методом контурування. Ми обчислюємо правило рішення за тонкою решіткою точок, а потім використовуємо алгоритми контурування для обчислення меж.

Однак я продовжу описати, як отримати рівняння меж класу LDA.

Почнемо з простого двовимірного прикладу. Ось дані з набору даних Iris ; Я відкидаю вимірювання пелюсток і розглядаю лише довжину пелюсток і ширину пелюсток. Три класи позначені червоним, зеленим та синім кольорами:

Ірисовий набір даних

Позначимо засоби класу (центроїди) як . LDA передбачає, що всі класи мають однакову коваріацію в класі; з урахуванням даних, ця спільна матриця коваріації оцінюється (до масштабування) як , де сума над усіма точками даних, а центроїд відповідного класу віднімається від кожної точки.W = i ( x i - μ k ) ( x i - μ k ) мк1,мк2,мк3W=i(хi-мкк)(хi-мкк)

Для кожної пари класів (наприклад, та класу ) існує межа класів між ними. Очевидно, що межа повинна проходити через середню точку між двома класовими центрами . Один з центральних результатів LDA полягає в тому, що ця межа є прямою ортогональною до . Існує кілька способів отримати цей результат, і хоча це не було частиною питання, я коротко натякну на три з них у додатку нижче.12(мк1+мк2)/2W-1(мк1-мк2)

Зауважимо, що написане вище - це вже точне визначення межі. Якщо потрібно мати рівняння прямої у стандартній формі , тоді можна обчислити коефіцієнти і і будуть задані деякими безладними формулами. Я навряд чи уявляю ситуацію, коли це було б потрібно.у=ах+баб

Давайте тепер застосуємо цю формулу до прикладу Іриса. Для кожної пари класів я знаходжу середню точку і будую лінію, перпендикулярну до :W-1(мкi-мкj)

LDA набору даних Iris, межі прийняття рішень

Три лінії перетинаються в одній точці, як і слід було очікувати. Межі рішення задаються променями, починаючи від точки перетину:

LDA набору даних Iris, межі остаточного рішення

Зауважте, що якщо кількість класів дорівнює , то буде пари класів і так багато ліній, всі перетинаються в заплутаному безладі. Щоб намалювати приємну картину на зразок Hastie та ін., Потрібно зберегти лише необхідні сегменти, і це окрема алгоритмічна проблема сама по собі (ніяк не пов'язана з LDA, тому що її не потрібно робити класифікація; щоб класифікувати точку, або перевіряйте відстань махаланобіса до кожного класу та вибирайте найменшу відстань, або використовуйте послідовні чи парні ЛДА).K ( K - 1 ) / 2К2К(К-1)/2

У вимірах формула залишається точно такою ж : межа є ортогональною до і проходить через . Однак у вищих розмірах це вже не лінія, а гіперплан розмірів . Для ілюстрації можна просто спроектувати набір даних на перші дві дискримінантні осі і, таким чином, звести проблему до випадку 2D (що, на мою думку, це зробили Хасті та ін., Щоб отримати цю цифру).D>2W-1(мк1-мк2)(мк1+мк2)/2D-1

Додаток

Як побачити, що межа є прямою ортогональною до ? Ось кілька можливих способів отримання цього результату:W-1(мк1-мк2)

  1. Фантастичний шлях: індукує махаланобіс метрику на площині; межа має бути ортогональною до у цій метриці QED.W-1мк1-мк2

  2. Стандартний гауссовий спосіб: якщо обидва класи описуються розподілами Гаусса, то ймовірність того, що точка належить до класу , пропорційна . На межі ймовірність належності до та класів однакова; запишіть його, спростіть, і ви негайно дістанетесь до , QED.хк(х-мкк)W-1(х-мкк)12хW-1(мк1-мк2)=cонст

  3. Працелюбний, але інтуїтивний спосіб. Уявіть, що є матрицею ідентичності, тобто всі класи є сферичними. Тоді рішення очевидно: межа просто ортогональна до . Якщо заняття не сферичні, то можна зробити їх такими шляхом сферизації. Якщо власне розкладання є , то матриця зробить трюк (див. наприклад тут ). Тож після застосування межа є ортогональною до . Якщо ми візьмемо цю межу, перетворимо її назадWмк1-мк2WW=UDUS=D-1/2USS(мк1-мк2)S-1 і запитайте, що це зараз ортогонально, відповідь (залишено як вправа): на . Підключаючи вираз до , отримуємо QED.SS(мк1-мк2)S


Я не вивчав вашої відповіді. Це здається витонченим і може бути правильним. Що стосується практичного та простішого підходу "посипати точки, класифікувати, а потім виводити межі", який я окреслив у коментарі? Чи порівняний ваш підхід з його результатами (які, очевидно, правильні)? Що ти думаєш?
ttnphns

1
@ttnphns: Єдина технічна частина моєї відповіді (нумерований список з 3 пунктами) дає певні докази, і їх можна сміливо пропустити. Решта, я вважаю, не особливо витончена! Можливо, я повинен перемістити ту «зайву» частину вниз, як додаток? Щодо ваших коментарів: Я думаю, що це правильний підхід, і мені подобається, як ASCII виглядає на "територіальній карті" SPSS. Можливо, ви могли б перенести свої коментарі до окремої відповіді (і дати там зразкову картину карти SPSS), я думаю, це було б корисно для подальших посилань. Звичайно, результати повинні бути рівнозначними.
амеба каже, що поверніть Моніку

@ttnphns: виявляється, що Hastie та ін. використовував саме описаний тут метод, щоб побудувати їхні фігури, включаючи той, який відтворений в ОП. Я знайшов виноску, яка говорить саме про це (і оновила свою відповідь, цитуючи її на початку).
амеба каже, що повернеться до Моніки

Вау! відмінна відповідь (через 3 роки!) Я можу запитати, як у вас виникла сегменти цієї конкретної проблеми?
Xavier Bourret Sicotte
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.