Ну, якщо у вас є зразок з розподілу парето з параметрами m > 0 і α > 0 (де m - нижній граничний параметр, а α - параметр форми), ймовірність журналу цього зразка:X1,...,Xnm>0α>0mα
nlog(α)+nαlog(m)−(α+1)∑i=1nlog(Xi)
це монотонно зростає в , тому максимізатор - найбільше значення, що відповідає спостережуваним даним. Оскільки параметр m визначає нижню межу опори для розподілу Парето, оптимальним єmm
m^=miniXi
що не залежить від . Далі, використовуючи звичайні підрахунки, MLE для α має задовольнятиαα
nα+nlog(m^)−∑i=1nlog(Xi)=0
деяка проста алгебра говорить нам, що MLE єα
α^=n∑ni=1log(Xi/m^)
У багатьох важливих сенсах (наприклад, оптимальна асимптотична ефективність завдяки досягненню нижньої межі Крамера-Рао) це найкращий спосіб пристосування даних до розподілу Парето. R нижче код обчислює MLE для заданого набору даних, X
.
pareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) )
}
# example.
library(VGAM)
set.seed(1)
z = rpareto(1000, 1, 5)
pareto.MLE(z)
[1] 1.000014 5.065213
Edit: На основі коментарів по @cardinal і я нижче, ми можемо також відзначити , що альфа є зворотною вибірки середнього значення колоди ( X я / м ) «s, що трапиться мати експоненціальне розподіл. Тому, якщо ми маємо доступ до програмного забезпечення, яке може відповідати експоненціальному розподілу (що скоріше, оскільки це, мабуть, виникає у багатьох статистичних проблемах), то встановлення розподілу Парето може бути здійснено шляхом трансформації набору даних таким чином і підгонки його до експоненціального розподілу за трансформованою шкалою. α^log(Xi/m^)