У мене є кілька наборів даних в порядку тисячі балів. Значення у кожному наборі даних - X, Y, Z, що стосуються координати в просторі. Значення Z являє собою різницю висот у парі координат (x, y).
Зазвичай в моєму полі ГІС на похибку висоти посилається в RMSE шляхом віднімання точки земної істини до точки вимірювання (точка даних LiDAR). Зазвичай використовується як мінімум 20 контрольно-пропускних пунктів заземлення. Використовуючи це значення RMSE, згідно з NDEP (National Digital Elevation Guidelines) та керівництвом FEMA, можна визначити міру точності: Точність = 1,96 * RMSE.
Ця точність вказана як: "Фундаментальна вертикальна точність - це значення, за допомогою якого вертикальну точність можна справедливо оцінити та порівняти між наборами даних. Фундаментальна точність обчислюється на 95-відсотковому рівні довіри як функція вертикальної RMSE."
Я розумію, що 95% площі під нормальною кривою розподілу лежить в межах 1,96 * стд. Відхилення, однак це не стосується RMSE.
Як правило, я задаю це питання: Використовуючи обчислені RMSE з 2-х наборів даних, як я можу пов'язати RMSE з якоюсь точністю (тобто 95 відсотків моїх точок даних знаходяться в межах +/- X см)? Крім того, як я можу визначити, чи мій набір даних зазвичай розподіляється за допомогою тесту, який добре працює з таким великим набором даних? Що "достатньо добре" для нормального розподілу? Чи повинен p <0,05 для всіх тестів, чи він повинен відповідати формі нормального розподілу?
Я знайшов дуже гарну інформацію на цю тему в наступному документі:
http://paulzandbergen.com/PUBLICATIONS_files/Zandbergen_TGIS_2008.pdf