Плутанина щодо кригінгу


9

Я читав цю статтю у Вікіпедії, пов’язану з кригінгом. Я не розумів тієї частини, коли це говорить

Крігінг обчислює найкращий лінійний неупереджений оцінювач , таким чином, що відхилення кригинга мінімізується при умові неупередженості. Я не отримав деривацію, а також як зменшення дисперсії. Будь-які пропозиції?Z^(x0)Z(x0)

Спеціально, я не отримав ту частину, де застосовується мінімізовано за умови неупередженості.

Я думаю, це мало бути

E [Z '(x0) -Z (x0)] замість E [Z' (x) -Z (x)] чи не так. 'еквівалентно капелюху у статті вікі. Також я не зрозумів, як виводиться помилка крігінгу


Де ви зависли у виведенні?
whuber

Частина, де вона обчислює помилку кригінгу і накладає умову неупередженості. Добре сказати, що неупереджений стан означає очікування оцінки, а справжній - рівний. Я відредагував публікацію, щоб включити деталі.
користувач31820

Я думаю, ви правильні, що вираз у Вікіпедії повинен читати . E[Z(x0)Z(x0)]
whuber

Відповіді:


13

Припустимо, - вектор, який вважається багатовимірним розподілом невідомого середнього та відомої матриці дисперсії-коваріації . Ми спостерігаємо з цього розповсюдження і бажаємо передбачити з цієї інформації, використовуючи неупереджений лінійний предиктор:(Z0,Z1,,Zn)(μ,μ,,μ)Σ(z1,z2,,zn) z0

  • Лінійний означає, що прогноз повинен приймати форму для визначених коефіцієнтів . Ці коефіцієнти можуть залежати максимум від того, що відомо заздалегідь: а саме записів .z0^=λ1z1+λ2z2++λnznλiΣ

Цей предиктор також можна вважати випадковою змінною .Z0^=λ1Z1+λ2Z2++λnZn

  • Незаангажований означає, що очікування дорівнює його (невідомому) середньомуZ0^μ .

Виписування речей дає деяку інформацію про коефіцієнти:

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

Другий рядок обумовлений лінійністю очікування, а все інше - проста алгебра. Оскільки ця процедура, мабуть, працює незалежно від значення , очевидно, коефіцієнти повинні дорівнювати одиниці. Записавши коефіцієнти у векторні позначення , це можна акуратно записати .μλ=(λi)1λ=1

Серед безлічі всіх таких неупереджених лінійних предикторів ми шукаємо такий, який відхиляється якнайменше від реальної величини , виміряної в середньому квадраті кімнати. Це, знову ж таки, обчислення. Він спирається на біліарність та симетрію коваріації, застосування якої відповідає за підсумки у другому рядку:

E[(Z0^Z0)2]=E[(λ1Z1+λ2Z2++λnZnZ0)2]=i=1nj=1nλiλjvar[Zi,Zj]2i=1nλivar[Zi,Z0]+var[Z0,Z0]=i=1nj=1nλiλjΣi,j2i=1nλiΣ0,i+Σ0,0.

Звідси коефіцієнти можна отримати, мінімізуючи цю квадратичну форму з урахуванням (лінійного) обмеження 1λ=1. Це легко вирішується методом множників Лагранжа, отримуючи лінійну систему рівнянь, "рівняння Кріґінга".

У додатку Zце просторовий стохастичний процес ("випадкове поле"). Це означає, що для будь-якого заданого набору фіксованих (не випадкових) локаційx0,,xn, вектор значень Z у цих місцях, (Z(x0),,Z(xn))є випадковим із деяким різновидовим розподілом. ПишітьZi=Z(xi)і застосувати вищевикладений аналіз, припускаючи засоби процесу взагаліn+1 локації xiє однаковими і припускаючи матрицю коваріації значень процесу при нихn+1 локації відомі з певністю.

Давайте інтерпретувати це. За припущеннями (включаючи постійну середню і відому коваріацію) коефіцієнти визначають мінімальну дисперсію, досяжну будь-якого лінійного оцінювача. Назвемо цю дисперсіюσOK2("ОК" - це "звичайний крігінг"). Це залежить виключно від матриці . Це говорить нам, що якби ми неодноразово вибір з і використовували ці коефіцієнти, щоб передбачити значення від решти значень кожного разу, тоΣ(Z0,,Zn)z0

  1. В середньому наші прогнози були б правильними.

  2. Як правило, наші прогнози z0 відхилиться б о σOK від фактичних значень z0.

Набагато більше потрібно сказати, перш ніж це вдасться застосувати до практичних ситуацій, таких як оцінка поверхні за пунктуальними даними: нам потрібні додаткові припущення про те, як статистичні характеристики просторового процесу змінюються від одного місця до іншого та від однієї реалізації до іншої (навіть якщо на практиці зазвичай буде доступна лише одна реалізація). Але цієї експозиції має бути достатньо для того, щоб прослідкувати, як пошук "найкращого" неупередженого лінійного передбачувача ("BLUP") прямо веде до системи лінійних рівнянь.


До речі, кригінг, як це зазвичай практикується, не зовсім збігається з оцінкою найменших квадратів Σоцінюється за попередньою процедурою (відомою як "варіографія") з використанням тих же даних. Це суперечить припущенням цього походження, яке передбачалосяΣбув відомийfortiori незалежний від даних). Таким чином, на самому початку кригінг має в собі вбудовані деякі концептуальні та статистичні вади. Продумані практики завжди усвідомлювали це і знаходили різні творчі способи (намагатися) виправдати невідповідності. (Наявність великої кількості даних може реально допомогти.) Зараз існують процедури для одночасного оцінюванняΣі передбачення колекції значень у невідомих місцях. Для досягнення цього подвигу вони потребують дещо сильніших припущень (багатоваріантність нормальності).


Там є веб-сайт, на якому хлопці гнаються проти кригінгу, і, здається, у нього є деякі дійсні бали. Я думаю, ваш остаточний параграф тут дуже яскравий.
Уейн

@Wayne Так, ви можете сказати, на що я реагую. Але хоч кригінг був використаний консультантами як "зміїна олія", але для цього потрібно багато чого, включаючи теорію "зміни підтримки" для порівняння даних, отриманих із (скажімо, крихітних зразків носія), з даними, отриманими з набагато більшого розміру частини цього середовища. Кінггінг в кінцевому підсумку знаходиться в основі найскладнішого просторово-часового моделювання сьогодні. Це також корисний спосіб оцінити альтернативні пропозиції: наприклад, багато просторових інтерполяторів є лінійними (або можуть бути лінеаризованими), тому справедливо порівняти їх відмінність оцінки з оцінкою кригінгу.
whuber

1

Кригінг - це просто мінімальна оцінка площ для просторових даних. Як такий, він надає лінійний неупереджений оцінювач, що мінімізує суму помилок у квадраті. Оскільки воно є неупередженим, MSE = відхилення оцінювача і є мінімальним.


Я не отримав частину, що обчислює помилку крігінга. Також я плутаю дисперсію кригінгу та дисперсію. У чому різниця і в чому їх значення
користувач31820

@whuber. Дякую за пояснення, але я не отримав виведення рівняння, коли ви обчислювали значення MSE, передбачене об'єктивною оцінкою та справжнім оцінником. Другий рядок, конкретний у цьому рівнянні
user31820

@whuber Також я не отримав частину вікі, коли вона обчислює відмінність кригінгу, яка схожа на ту, що у вашій відповіді. Вони мають однакові результати, але початкові умови різні. Як це?
користувач31820
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.