Як параметризувати співвідношення двох нормально розподілених змінних або зворотну одну?


12

Проблема: я параметризую розподіли для використання в якості апріорів та даних у байєсівському метааналізі. Дані наводяться в літературі у вигляді підсумкової статистики, майже виключно вважається звичайно розподіленою (хоча жодна зі змінних не може бути <0, деякі - відношеннями, деякі - масовою тощо).

Я натрапив на два випадки, для яких у мене немає рішення. Іноді параметром, що цікавить, є обернена інформація або співвідношення двох змінних.

Приклади:

  1. відношення двох нормально розподілених змінних:
    • дані: середнє значення та sd для відсотків азоту та відсотків вуглецю
    • параметр: відношення вуглецю до азоту.
  2. обернення нормально розподіленої змінної:
    • дані: маса / площа
    • параметр: площа / маса

Мій сучасний підхід полягає у використанні моделювання:

наприклад, для набору даних про відсоток вуглецю та азоту із засобами: xbar.n, c, дисперсія: se.n, c, розмір вибірки: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Я хочу параметризувати ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Тоді виберіть найбільш підходящі дистрибутиви з діапазоном для мого попереднього0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Запитання: Це правильний підхід? Чи є інші / кращі підходи?

Спасибі заздалегідь!

Оновлення: розподіл Коші, який визначається як співвідношення двох нормалей з , має обмежену корисність, оскільки я хотів би оцінити дисперсію. Можливо, я міг би обчислити дисперсію моделювання n малюнків із Коші?μ=0

Я знайшов такі наближення закритої форми, але я не перевіряв, чи дають вони однакові результати ... Hayya et al., 1975

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. and Armstrong, D. and Gressis, N., 1975. Примітка про співвідношення двох нормально розподілених змінних. Наука управління 21: 1338--1341


Чи слід розміщувати Оновлення питання про обчислення дисперсії на випадкових малюнках із Коші як окреме запитання?
Девід Лебоуер

david - оскільки ваші змінні позитивні, чому ви хочете метушитися з ? btw - у вашому моделюванні ви, здається, генеруєте змінні per.c та per.n, які не залежать. це правильно - і якщо так, це те, що ви хочете? μ=0
ronaf

ні, я не хочу метушитися з = 0; ці змінні, як правило, трактуються як незалежні, а дані про коваріацію рідко доступні. Оскільки С досить постійний, незалежність є розумним припущенням. μ
Девід Лебоуер

Я не розумію, чому очікування співвідношення не існує. Якщо і спільно нормально розподілені зі значенням, відмінним від нуля, то середнє значення задається , що я пропускаю? Y Z = XXYxZ=XYxyp(x,y)dxdy
Рой

Відповіді:


6

Можливо, ви хочете переглянути деякі посилання в статті Вікіпедії про розподіл співвідношення . Можливо, ви знайдете кращі наближення чи дистрибуції для використання. Інакше ваш підхід здається здоровим.

Оновлення Я думаю, що краща довідка може бути:

Дивіться формули 2-4 на сторінці 195.

Оновлення 2

Що стосується Вашого оновленого питання щодо дисперсії від Коші - як зазначив Джон Кук у коментарях, дисперсії не існує. Отже, взяття вибіркової дисперсії просто не працюватиме як "оцінювач". Насправді ви виявите, що дисперсія вашої вибірки взагалі не збігається і коливається, коли ви продовжуєте брати зразки.


Дякую за довідку, саме там я знайшов посилання на Хааю 1975 року та рівняння в моєму запитанні, хоча буду вдячний запевнити, що рівняння підходять для моєї проблеми.
Девід Лебоуер

Швидко поглянувши на Хааю, здається, що вони стурбовані отриманням нормального наближення для співвідношення і використовують моделювання, щоб визначити, коли це застосовується (використовуючи коефіцієнт варіації, cv). Чи відповідає резюме у вашому випадку критеріям? Якщо так, застосовуються наближення.
ars

1
@David: використовуйте Marsaglia 1965 замість оновленого у відповіді.
ars

NB: Marsaglia опублікував оновлення в JSS у 2004 році .
David LeBauer

XYZ=XYxyp(x,y)dxdy

0

y1N(.,.)

Моя пропозиція щодо використання Коші не спрацьовує, як зазначено в коментарях ars та John.

Співвідношення двох нормально випадкових величин слід за розподілом Коші . Ви можете скористатися цією ідеєю для визначення параметрів каучука, який найбільше відповідає вашим даним.


а. Мені потрібно оцінити дисперсію, а дисперсія розподілу Коші не визначена.
Девід Лебоуер

б. Якщо я розумію ваш другий пункт, так, я можу припустити, що y-1 ~ N (mu, sigma), але мені все ж потрібно обчислити mu і sigma з узагальненої статистики, поданої для y; також я вирішив не вважати розподіли зі значеннями <0 лише для визначених змінних> 0 (хоча у багатьох випадках p (X <0 | X ~ N (mu, s)) -> 0)
Девід Лебоуер

Чи не застосовується Коші для нульових середніх норм?
ars

@ars Ви маєте рацію. Тоді капуста може бути обмеженою.

Ars: Так, я вважаю, що для результату Коші потрібні нульові засоби. Але це все ще означає, що принаймні в тому спеціальному випадку відмінність, яку намагається оцінити Девід, НЕ існує.
Джон Д. Кук
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.