Бета-версія розподілу в Scipy


14

Згідно з Вікіпедією, бета-розподіл ймовірностей має два параметри форми: і β .αβ

Коли я дзвоню scipy.stats.beta.fit(x)в Python, де xзнаходиться купа чисел у діапазоні , повертаються 4 значення. Це вражає мене дивним.[0,1]

Після googling я знайшов, що одне з повернених значень має бути "location", оскільки третя змінна - 0, якщо я викликаю scipy.stats.beta.fit(x, floc=0).

Хтось знає, що таке четверта змінна, і якщо перші два - і β ?αβ


1
Документація називає останні два «місце розташування» і «масштаб» параметрів. Таким чином, четвертий - параметр шкали. Розташування та масштаб мають стандартні статистичні значення. Одне тлумачення в цьому контексті чітко дано в посібнику NIST .
whuber

У мене це саме таке питання, але чомусь усі мої бета-моделі мають тенденцію "затримувати воду". Наприклад, stats.beta.fit([60,61,62,72])я отримую (0.7313395126217731, 0.7153715263378897, 58.999999999999993, 3.3500998441036982). Будь-яка ідея, що я можу зробити з цього приводу?
TheChimera

Просто додайте цю документацію до загального методу безперервної випадкової змінної, який містить декілька прикладів, використовуючи beta.fit (): docs.scipy.org/doc/scipy/reference/generated/…
mathisfun

Відповіді:


13

Незважаючи на очевидну відсутність документації про вихід beta.fit , він виводить у такому порядку:

αβ


Це просто виплескування нижньої та верхньої меж, виходячи з діапазону даних, або щось інше?
shadowtalker

Межі засновані на розподілі ймовірностей. тобто. Нормальний розподіл не має меж, але вибіркові дані рідко перевищують ~ +/-3. Бета-розподіл має жорсткі межі, імовірність 0 перевищує ці межі. Цілком імовірно, що ваші дані не досягнуть меж, залежно від того, що ви моделюєте. Насправді, намагатися змусити ці межі відповідати діапазону даних може бути проблематичним, оскільки багато бета-розподілу мають тенденцію до нульової ймовірності за межами. Докладніше з цього питання див. У цій публікації .
jdj081

1
Так, я знаю. Ці межі завжди дорівнюють 0 і 1. Отже: які верхня та нижня межі повертаються за допомогою цієї функції, і як вони взагалі збігаються з "розташуванням" та "шкалою"? Я думаю, я просто не розумію цієї відповіді.
shadowtalker

2
У способі визначення бета-розподілу ці межі завжди дорівнюють 0 і 1. Але узагальнений бета-розподіл включає ці два коефіцієнти масштабування. Модель, яку я моделю, не падає між 0 і 1, тому мені доведеться використовувати ці числа. Якщо ваші дані між 0 і 1, то виходи повинні бути дуже близькими до 0 і 1. Якщо ви знаєте, що ваші обмеження дорівнюють 0 і 1, ви можете примусити їх використовувати з floc=0і fscale=1kwargs. Ви все одно отримаєте ці результати, але вони будуть ідентичними тому, що ви їх змушуєте. І це, ймовірно, змінить ваші значення альфа та бета-версії.
jdj081
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.