Візуалізуйте біваріантний біноміальний розподіл


11

Запитання: як виглядає двовимірний біноміальний розподіл у тривимірному просторі?

Нижче наведена конкретна функція, яку я хотів би візуалізувати для різних значень параметрів; а саме , і .p 1 p 2np1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

Зауважте, що є два обмеження; і . Крім того, - натуральне число, скажімо, .p 1 + p 2 = 1 n 5x1+x2=np1+p2=1n5

Зробили дві спроби побудувати функцію за допомогою LaTeX (TikZ / PGFPLOTS). Роблячи так, я отримую графіки нижче для таких значень: , і , і, , і відповідно. Я не мав успіху в застосуванні обмеження на значення домену; x_ {1} + x_ {2} = n , тому я трохи спотикався.p 1 = 0,1 p 2 = 0,9 n = 5 p 1 = 0,4 p 2 = 0,6 x 1 + x 2 = nn=5p1=0.1p2=0.9n=5p1=0.4p2=0.6x1+x2=n

Візуалізація, створена будь-якою мовою, буде добре (R, MATLAB тощо), але я працюю в LaTeX з TikZ / PGFPLOTS.

Перша спроба

n=5 , p1=0.1 і p2=0.9

введіть тут опис зображення

Друга спроба

n=5 , p1=0.4 і p2=0.6

введіть тут опис зображення

Редагувати:

Для довідки, ось стаття, що містить деякі графіки. Заголовок статті - "Новий біваріантний біноміальний розподіл" Атану Бісваса та Цзін-Шианг Хванга. Статистика та ймовірнісні листи 60 (2002) 231–240.

Редагування 2: Для наочності та у відповідь на @GlenB в коментарях нижче наведено короткий знімок того, як мені було представлено дистрибутив у моїй книзі. Книга не стосується вироджених / невироджених випадків тощо. Він просто представляє це так, і я прагнув його візуалізувати. Ура! Також, як вказував @JohnK, існує ймовірність помилки друку стосовно x1 + x1 = 1, яка, на його думку, повинна бути x1 + x1 = n.

введіть тут опис зображення

Зображення рівняння від:

Спанос, А. (1986) Статистичні основи економетричного моделювання. Cambridge University Press


5
Але це не повинно бути суцільним, чи не так? Обидві випадкові величини дискретні.
ДжонК

1
Тож x1 та x2 є незалежними, чи не так? Вам потрібен псевдо-3D сюжет? Чи допустима б теплова карта?
gung - Відновіть Моніку


2
@JohnK Якщо і ви маєте справу з (а - просто ). Це однофакторний двочлен (або, вважається двоваріантним, він вироджений ). p 1 + p 2 = 1 X 1двочлен ( n , p 1 ) X 2 n - X 1x1+x2=np1+p2=1X1Binomial(n,p1)X2nX1
Glen_b -Встановіть Моніку

3
У вашому запитанні немає специфікації двовимірного двочлена. (Існує більше ніж один спосіб вказати біваріантний розподіл, який, правдоподібно, можна назвати "двочленним". У вас немає жодного з них, хоча ваш вироджений був би особливим випадком деяких з них.) ... малюнки в Ваша довідка Biswasa & Hwang не підходить для відображення дискретного двовимірного pmf. Коротше кажучи, ваше запитання не має нічого , щоб малювати, і ваша посилання корисна в основному в якості прикладу того , що б уникнути.
Glen_b -Встановіть Моніку

Відповіді:


8

До цього є дві частини: спочатку потрібно розібратися, що таке індивідуальні ймовірності, потім потрібно якось побудувати їх.

Біноміальний ПМФ - це лише сукупність ймовірностей для ряду "успіхів". Біваріантний біноміальний PMF буде набором ймовірностей над сіткою можливих комбінацій «успіхів». У вашому випадку у вас , тому (маючи на увазі, що успіхів - це можливість), існує можливих результатів в сітковому / двовимірному двочленному розподілі. 0 6 × 6 = 36ni=nj=506×6=36

Ми можемо спочатку обчислити граничні біноміальні ПМФ, оскільки це так просто. Оскільки змінні є незалежними, кожна спільна ймовірність буде просто добутком граничних ймовірностей; це матрична алгебра. Тут я демонструю цей процес за допомогою Rкоду:

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

На даний момент ми маємо дві необхідні матриці ймовірностей. Нам просто потрібно вирішити, як ми хочемо їх побудувати. Якщо чесно, я не є великим шанувальником діаграм 3D барів. Оскільки, Rздається, згодні зі мною, я зробив такі сюжети в Excel:

b19:

введіть тут опис зображення

b46:

введіть тут опис зображення


Дякуємо за презентацію плюс код R. Це змушує мене запитати про x1 + x2 = n. Якщо ця умова виконується, чи повинен бути лише один рядок стовпів, як це представлено тут: reference.wolfram.com/language/ref/MultinomialDistribution.html Графік вольфрама, який я припускаю, - це те, що @Glen_b називає виродженим випадком? Чи означає це, що ви представили вироджений випадок?
Graeme Walsh

1
GraemeWalsh, моя презентація не показує двовимірного двочлена, де x1 + x2 = n. Як @Glen_b широко обговорював у коментарях та його відповіді, я б дійсно не називав, що "двовимірний біноміальний розподіл" не кваліфікує це. Більше того, це означало б, що x1 & x2 не є незалежними, як ви сказали у коментарі до відповіді, а повністю залежні. По правді кажучи, я не помітив, що це такий химерний варіант (ви можете звинуватити мене в тому, що я не читав достатньо уважно). Як показав Glen_b, ця версія буде єдиною лінією стовпів. Що я представив, це випадок, що не вироджений.
gung - Відновіть Моніку

@gung Мені подобаються твої нові сюжети. Я вважаю, що ваша дискусія чудово охоплює вироджений випадок ("вам потрібно розібратися, що таке індивідуальні ймовірності" насправді все говорить; фактичні розрахунки для виродженого випадку тривіальні); Я щойно провів ці банальні розрахунки.
Glen_b -Встановіть Моніку

7

Відповідь Гунга - це хороша відповідь на фактичний двоманійний двочлен, який добре пояснює питання (я б рекомендував прийняти його як гарну відповідь на головне питання, швидше за все, корисний для інших).

x1n

Тож давайте правильно визначимо речі. Зауважте, що визначення випадкової величини насправді не пропонується, тому ми залишаємося з певними здогадами.

Y1binomial(n,p1),P(Y1=y1)y1y1=0,1,...,nX1=Y1/nx1=0,16,26,...,1

P(X1=x1)x2=nx1p2=1p1

n=6,p1=0.3

введіть тут опис зображення

x2x11x1x2

Ми можемо розцінювати це як (масштабний) вироджений двоманійний двочлен:

введіть тут опис зображення

але це трохи розтягнення, щоб насправді називати те, що визначено в книзі, двомаріальним двочленним (оскільки це фактично односхилий двочлен).

За припущенням, що хтось захоче генерувати подібний сюжет до 3D, цей невеликий (R) код стає досить близьким до другого сюжету вище:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

(Вам потрібен scatterplot3dпакет, який містить однойменну функцію.)

"Справжній" (не вироджений) двомаріатний двочлен має варіацію обох змінних одночасно. Ось приклад одного конкретного виду двовимірного двочлена (не незалежного в даному випадку). Я вдався до використання різних кольорів у сюжеті, тому що занадто легко загубитися в лісі «палицями» інакше.

введіть тут опис зображення

Хбункер(н0,p)Yбункер(ну,p)Zбункер(нz,p)Х1=Х+YХ2=Х+Z

Х1Х2

н0нунz=Хх1=х2х1+х2=н

[1]: Хамдан, М.А. (1972),
"Канонічне розширення біваріантного біноміального розподілу нерівними граничними показниками"
Міжнародний статистичний огляд , 40 : 3 (грудень), стор 277-280


corr(X1,X2)=1

Glen_b. Велике спасибі. Вказуючи, що математичний об’єкт, який я представив (який мені подарували!), Є (зменшеним) виродженим двомариальним двочленним дуже корисним! Я не знав цього з самого початку. Нарешті, елементарний запит! Чи можна було б вам чітко (шляхом математичного позначення) про те, як ви визначаєте справжній чи фактичний двовимірний двочлен? Це було б корисно, я думаю.
Graeme Walsh

1
Хбункер(н0,p)Yбункер(ну,p)Zбункер(нz,p)Х1=Х+YХ2=Х+Z

1
Х1Х2

@Graeme ... Планую додати ще кілька деталей.
Glen_b -Встановіть Моніку

4

Mathematicaзараз досить сильний у таких речах - це вирішення вашої проблеми прямо в документації . З невеликими доповненнями я створив модель для розігрування ( p = p1 = 0.4для кращого візуального представлення). Ось як виглядає інтерфейс і яким чином ним можна керувати.

введіть тут опис зображення

Знімок

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

Тут PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}]я думаю, що тут головне . Multinomialпросто означає, що ви можете взяти багато дистрибутивів piдля кожної відповідної змінної. Проста форма така BinomialDistribution. Звичайно, я міг би зробити це вручну, але правило - якщо у вас є вбудована функція - ви повинні використовувати її.

Якщо вам потрібні коментарі щодо структури коду, будь ласка, дайте мені знати.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.