Значення представлення симплексу як трикутної поверхні в розподілі Діріхле?


9

Я читаю з книги, яка представляє дистрибуцію Dirchilet, а потім представила цифри про неї. Але я не дуже зміг зрозуміти ці цифри. Я прикріпив фігуру тут, внизу. Що я не розумію - це значення трикутників.

Зазвичай, коли потрібно побудувати функцію з двох змінних, ви берете значення var1 і va2, а потім будуєте значення значення функції цих двох змінних ..., що дає візуалізацію в тривимірному вимірі. Але тут є 3 виміри та одне інше значення для значення функції, тому воно робить візуалізацію в 4D просторі. Я не можу зрозуміти цих цифр!

Я сподіваюся, що хтось може їх уточнити, будь ласка!

EDIT: ось що я не розумію з рисунка 2.14a. Отже, ми витягли з K = 3 диріхлету зразок тети (який в основному є вектором), тобто: theta = [theta1, theta2, theta3]. Ділянки трикутника [theta1, theta2, theta3]. Відстань від початку до кожного theta_i - це значення theta_i. Потім для кожного theta_i він поставив вершину і з'єднав усі три вертепи і склав трикутник. Я знаю, що якщо я підключу [theta1, theta2, theta3] у dir (theta | a), я отримаю одне число, яке є спільною ймовірністю вектора тети. Я також розумію, що ймовірність для безперервних випадкових величин є мірою площі. Але тут у нас є 3 розміри, тому спільна ймовірність буде мірою об’єму простору від рожевої площини і під ... тобто пірамідою. Зараз я не розумію, яка тут роль трикутника.

введіть тут опис зображення


2
Я пропоную почати з бета-версії та працювати звідти. Діріхлет для 3 - це "просто" логічне розширення бета-версії, а саме Діріхле для 2.
Андріс Біркманіс

Перевірте приклад для цієї теми
Tim

Може бути корисним думати, що бета-розподіл показано у 2D (вісь x, що представляє бінарний результат {0,1} та вісь y, що представляє ймовірність), тому для потрійного результату потрібен додатковий вимір, правда?
Джордж

Відповіді:


4

Я не розумію, яка тут роль трикутника. Що це намагається спілкуватися чи візуалізувати?

Усі точки в трикутнику повинні задовольняти двом обмеженням: між нулем та одним у кожному вимірі (0θ1) і підсумовувати до одного (θ0+θ1+θ2=1).

Я, нарешті, зрозумів це:

фігура

Отже (а) показує 3-D пробіл з θ1,2,3як координати. Вони варіюються лише від 0 до 1.

У (b) показаний трикутник, це наш симплекс.

(c) показано два приклади пунктів, які "лежать" на симплексі, які також відповідають другому критерію (підсумовує до одного).

(d) показує інший приклад точки симплекса, дотримуються тих же обмежень

У (е) я намагався показати проекцію симплексу на 2-D трикутник з усіма прикладними точками, показаними раніше.

Сподіваюся, зараз це має більше сенсу :)


2
Гарна картина. Це ваша? Якщо ні, то можете, будь ласка, надати посилання та це джерело?
Тім

1
Дякую. Це моє (намальовано за допомогою Inkscape), я можу надати SVG за потреби ...
Джон Доу

2

На графіку 2.14 (а) показана площина, складена трьома вершинами на кожній осі. Відстань вершини від початку єθi, що відповідає одному з k=3заняття. Область, огороджена рожевою площиною та площинами осей, є ймовірністю (вектор)θ. Тепер припустимо, що ви нахилите цю площину так, щоб у вас була піраміда з рожевою площиною, обличчям, найближчим до читача, розміщеним плоско на сторінці. Потім придушіть третій вимір "вискочить" сторінки і замість цього пофарбуйте трикутник, щоб область вищої щільності, з більшою відстані від основи до поверхні, стала червонішою. Ось що показують графіки 2.14 (b) та 2.14 (c). Чим більше червоний зосереджений біля вершини, тим більше ймовірність класу, пов'язаного з цією вершиною. Так само, якщо червона область не дуже близька до будь-якої вершини, то не особливо ймовірно, що подія має більшу ймовірність членства в будь-якому з класів.

Ця піраміда, однак, має сенс лише як єдине усвідомлення розподілу Діріхле. Знову черпання з одного розподілу може призвести до різної піраміди з різною довжиноюθдо кожної з вершин. Ключова різниця між (a) і (b) / (c) полягає в тому, що (a) графічно відображає ймовірність одного малювання вектораθ. Графіки (b) та (c) показують щільність ймовірності для значеньθ в k=3 симплекс, тобто вони намагаються представити функцію щільності ймовірності для всіх значень θв підтримку. Один із способів думати про (b) та (c) - це як точка, що має додатковий червоний колір відповідно до середньої висоти між плоскою рожевою площиною та поверхнею піраміди, усередненою на багатьох малюнкахθDir(α).


Деякі моменти досі не зрозумілі. Можливо, тому що моя слабка англійська. "Область, огороджена рожевою площиною та площинами осей, - це щільність." Це порожній простір піраміди під рожевою площиною? Також "щільність"? Що ви маєте на увазі? Як я розумію, що dir (x1, x2, x3) - це одне значення, як щільність тут входить у графік?
Джек Твен

Так, між рожевою площиною та площинами, утвореними чорними лініями в 2.14 (а), є простір піраміди, який я намагався описати. Вибачте за непорозуміння!
Sycorax каже, що повернеться до Моніки

Я відредагую свій пост, щоб далі пояснити те, що ще не зрозуміло
Джек Твен

річ у тому, що рожева область - це саме підтримка, описана в книзі. оскільки theta_k <= 1 і сума (theta_k) = 1. Як тільки ви це уявляєте, user777 абсолютно прав.
Скретч

@ user777 Я щойно змінив публікацію
Джек Твен
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.