У цій відповіді описаний об'єктивний метод вимірювання довільних розбіжностей між двома просторовими наборами даних. Такі розбіжності можуть включати зміщення положення, зміни форми та особливостей, присутніх в одному наборі даних, але не в іншому. Ця відповідь не дає жодних засобів визначити, що є "кращим", тому що це залежить набагато більше, ніж просто дані, і це особливо залежить від того, для чого будуть використовуватися дані.
Фон
Хороший фундамент для великого набору таких вимірювань покладається на евклідову трансформацію відстані кожного набору даних. Це розглядає кожен набір даних як представлення набору точок у площині. Назвемо ці колекції B для синіх рис та R для червоних.
Для будь-якої точки х в площині, евклидово відстані перетворення з безлічі точок обчислює нижню межу відстаней між й і А . Ми можемо думати , це перетворення , як створення «поверхні», висота якого при х одно найкоротша відстань від ї до А . Таким чином , ця поверхня має западини в усіх точках А , де його висота дорівнює нуль, і піднімається на 1: 1 схил від A . Зрозуміло, що перетворення відстані в свою чергу визначає A (або технічно його метричне закриття , яке для наборів даних GIS таке ж, як A) як множина всіх точок на висоті нуля. Таким чином, перетворення відстані повністю фіксує всю просторову інформацію A, яку може представляти ГІС.
Цей малюнок показує дистанційні перетворення B (зліва) та R (праворуч) у псевдорельєфі.
Порівняння двох датців
Щоб порівняти B і R , накладіть кожен з перетворенням відстані іншого:
Значення відстані відображаються як кольори, градуйовані від блюзу (біля 0) через червоні.
Ліва карта, наприклад, показує точки B і колір їх в відповідно до їх відстанями від R . Ролі B і R перемикаються в правильній карті.
Вже вони допомагають оцінювати порівняння: кожна карта показує точки одного набору даних і, використовуючи колір, підкреслює точки, далекі від будь-якої точки в іншому наборі даних. Зауважте, що обидві карти потрібні для порівняння, оскільки кожна показує точки не на іншій.
На детальних картах колір може бути важким, тому ми можемо вибрати його трохи розмити для презентації або візуальної оцінки:
Примітка: кольори не можна порівняти між двома картами: у межах кожної карти вони масштабуються, щоб відобразити повний діапазон відстаней на цій карті.
Статистичний аналіз відмінностей
Краса такого підходу полягає в тому, що можна зробити при післяобробці. Використовуючи растр для зображення перетворень відстані та їх накладень, ми можемо легко отримати статистику - локальну та глобальну - для вимірювання невідповідностей. Наприклад, ми можемо зосередитись на всіх відстанях, більших за якийсь невеликий поріг, вивчити їх частотний розподіл:
У цій гістограмі блакитні смуги - для синіх ознак, червоні - для червоних. (Зверніть увагу на логарифмічну шкалу на горизонтальній осі.) Ця гістограма показує вихідні накладені дані, а не похідні розмиті дані. У вихідному зображенні вибрано лише ті відстані, які перевищують три пікселі.
Ці гістограми показують, що для синіх рис набагато більше шансів лежати далеко від червоних рис, ніж навпаки : сині смуги вище, ніж червоні, і вони поширюються на більшу відстань (праворуч). Весь арсенал описової статистики тепер доступний для кількісного визначення відмінностей між двома наборами даних. Ці статистичні дані можуть бути застосовані до всього регіону, що цікавить, або "відкрити вікно" над ним, щоб вивчити, як обидва набори даних відрізняються залежно від місця розташування.
Впровадження
Більшість реєстрового GISes забезпечує евклидово відстані перетворення (наприклад, евклідової метрики в ArcGIS і r.grow.distance в GRASS), і все вони підтримують просту (маскування) накладень необхідно зробити цей аналіз. Розмивання, за бажанням, можна здійснити за допомогою середнього значення чи згортання ядра (що включає "гаусову розмитість", доступну у всіх програмному забезпеченні для обробки зображень). Більшість GISes цього НЕ забезпечує адекватну підтримку повного статистичного аналізу растрових даних, хоча, але вони гарні при експорті таких даних в форматах , читаються зі статистичними і програмно - математичного забезпечення , такі як R
або Mathematica (який зробив все цифри тут).