Мінімальна кількість зразків для крипової інтерполяції


19

Я отримую деякі дані з кількістю зразків із проханням інтерполювати їх за допомогою методу крігінгу.
Після деякого розслідування виявилось, що результати кригінгу (виконані в ArcGIS Geostatistic Analyst з параметрами за замовчуванням) не є задовільними. Інтерпольовані значення сильно відрізняються від вимірювань (особливо верхніх), і поверхня не виглядає надійною. Ось малюнок: введіть тут опис зображення
Я припускаю, що головна проблема - недостатня кількість зразків.

Скільки очок ми повинні використати, щоб отримати надійні результати?
Чи, можливо, метод крижінгу не підходить для таких розбіжних значень?


Ви сказали, що "Хоча люди успішно зафіксували цілих сім точок даних (у монографії Роберта Джернігана, опублікованій EPA США наприкінці 1980-х), ...". Але я не можу знайти цю статтю. Чи можете ви дати відкриту адресу для цієї статті? Дякую ...
sposobnostiici

Відповіді:


30

Коли ви використовуєте "значення за замовчуванням", ви насправді не кригізуєтесь, ви просто застосовуєте алгоритм крігінгу - який, як ви виявили, поганий при використанні з цими даними.

(Я піду на мильну скриньку на короткий розряд: на мою думку, найшвидший спосіб отримати погані результати за допомогою комп’ютерної програми - це прийняти параметри за замовчуванням. ArcGIS - це одне з найбагатших, найпотужніших середовищ для отримання поганих результатів. Мораль - не використовувати програмне забезпечення для важливих робіт, поки ви не зрозумієте, як ним керувати. Вниз від мильної скриньки зараз ...)

Щоб кригінг працювати, вам потрібно провести інтенсивний попередній статистичний аналіз даних, відомих як "варіографія". Наскільки добре це в кінцевому рахунку залежить від даних, а також від ваших геостатистичних навичок. (Про варіографію написано цілих книг, включаючи насінну гірничу геостатистику Джорнеля та Хуйдгрегтса та Варіовін Йвана Паннатьє.) Хоча люди успішно зафіксували лише сім точок даних (у монографії Роберта Джернігана, опублікованій американською EPA в наприкінці 1980-х рр.), і в принципі ви можете кригнути, використовуючи лише два-три пункти (я це зробив, щоб продемонструвати алгоритм ), правила роботи в літературі варіюються від мінімум 20 балів до 100 балів і консенсус Схоже, це близько 30 балів.

У вашому випадку - хоча ви не описуєте дані - у вас є явні проблеми, зокрема сильне перекошене розповсюдження та чітка відсутність доказів стаціонарності. Для них потрібна спеціальна статистична обробка або спеціалізовані форми кригінгу (наприклад, просторова узагальнена лінійна модель). Ви не отримаєте хороших результатів, коли зашифруєте такі дані, поки у вас не буде дуже великий обсяг даних.

Легенда передбачає, що ви можете намагатися створити щільність, а не інтерполювати дані: хоча результати двох процедур можуть виглядати однаково, вони роблять різну річ і мають чітко різні інтерпретації. Ви інтерполюєте, коли дані вважаються зразками з якоїсь гіпотетичної безперервної поверхні. Інтерполяція прогнозує непробовані значення. Стандартні приклади включають вимірювання висоти (яка відбирає земну поверхню) та вимірювання температури (яка вибірку "температурного поля"). Ви обчислюєте щільність, коли маєте повну інформацію про сумучогось, і ви хочете представити згладжений варіант цієї суми на одиницю площі. (На відміну від інтерполяції, не існує жодних неспроможних значень для прогнозування.) Стандартним прикладом є щільність популяції: дані - це підрахунки всіх осіб у межах району; вихід - карта щільності населення.


6
Чудова відповідь @whuber. Однак чи не мінімальна кількість балів також частково не залежить від міри просторової області та бажаного зерна прогнозу? Якщо віднести його до питання вибірки, то це стане питанням відображення сукупності та просторової зміни в вибірці.
Джефрі Еванс

@ Джефрі Це частково так. Кількість даних містить дві речі: відхилення прогнозування кригінгу (яке варіюється в просторовій області) та точність, з якою може бути оцінена сама варіограма. Останню часто не помічають, особливо в традиційному лікуванні крігінга: це щось на зразок слона в кімнаті. Якщо ви знаєте правильну варіограму і вона має невелике співвідношення самородок / підвіконня і великий діапазон відносно обсягу просторової області, ви можете скрутигуватися з надзвичайно мало даних, особливо якщо вони адекватно вибирають весь діапазон значень даних.
whuber

3
Я переконаний, що будь-хто, хто використовує крігінг, повинен мати або хороший курс геостатистики, або мати ґрунтовну ГІС / статистику. Нахиляючись, як правильно моделювати напівваріограму, потрібен певний навик.
Майк T

1
Основне правило, яке мене вразило: 30 балів за всенаправлений Крігінг і 100 для двонаправленого.
ярекс

1

Є два окремі запитання, по-перше, кількість локацій даних, які слід використовувати при оцінці / моделюванні варіограми, по-друге, кількість локацій даних, які слід використовувати в рівняннях кригінгу для інтерполяції значення в місці, яке не має даних (або для оцінки середнього значення над регіоном). Якщо припустити, що ви використовуєте рухомий мікрорайон пошуку, більш ніж 15-20 місцеположень даних у мікрорайоні, ймовірно, погіршать результати, оскільки (1) лише найближчі місцеположення даних у пошуковому районі матимуть ненульові ваги, (2) з більшою кількістю даних розташування розміру матриці, яку потрібно перевернути, більша, а можливість неправильного кондиціонування матриці збільшується. Загальна кількість місцеположень даних, необхідних для кригінгу, залежить від кількості локацій, які потрібно інтерполювати, та просторових моделей цих точок, а також від розташування даних. Коротко,

Що стосується оцінки / моделювання варіограми, це зовсім інша проблема, див

1991, Майєрс, DE, Про оцінку варіограми у працях першого Інтер. Конф. Стат. Комп., Чешме, Туреччина,

30 березня-2 квітня 1987 р., Т. II, American Sciences Press, 261-281

1987, А. Уоррік та Д.Є. Майєрс, Оптимізація місць відбору проб для варіограмних розрахунків водних ресурсів 23, 496-500

Їх можна завантажити на веб-сайті www.u.arizona.edu/~donaldm

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.