Інструменти просторової статистики: аналіз кластеризації растрових даних


9

У мене, мабуть, проста проблема, але я не можу знайти чітку методологію для використання.

Мені доручено розмежувати "міські райони" векторними опуклими багатокутниками, використовуючи набір даних Cridin Population of World від CIESIN

Цей набір даних надає значення щільності населення у всьому світі, як растровий файл. Проблема полягає в тому, що ви вже здогадалися, що значення щільності дуже змінюються, а визначення "міського" досить відносне.

Я намагався використовувати класичний підхід і обчислював схили так, ніби значення щільності були висотами, але значення схилів також були дуже розрізненими і просторово складними, хитросмуговими.

Я роздивився алгоритми просторової кластеризації, інструменти LISA (Local Indocators of Spatial Association), ArcGIS та GeoDa, але я дуже загубився серед дуже конкретних інструментів. Деякі з методів працюють лише над векторними формами, тому потрібна перекласифікація та векторизація (довгі обчислення).

Чи можете ви допомогти мені вдосконалити набір методів та інструментів, які слід використовувати? Дякую !


2
Що саме це ваше визначення «міський»? До речі, я б не очікував, що всі міські райони будуть належним чином описані опуклими багатокутниками. Багато з них мають форми, керовані географічними ознаками - гори, берегові лінії та річки - які сильно не опуклі.
whuber

Визначення не дано, не є постійним. Я думаю, що мета полягає в тому, щоб знайти субстанічно більш щільні райони щодо їхнього середовища, яке змінюється. Отже ідея про просторову статистику та LISA. Ви маєте рацію щодо опуклості, я повинен був написати "не перетинаючись і не перетинаючи інші багатокутники".
Лоран Джегу

Як доповнення я знайшов цілий модуль R, присвячений засобам просторової агломерації: spdep.
Лоран Джегу

Відповіді:


4

Я зробив деяку роботу над цим для свого MSc http://ian01.geog.psu.edu/papers/mscthesis.pdf - я в основному працював над змінами градієнта, але обговорення може допомогти вам у цьому.


Дякую, я незабаром прочитаю, але це багатообіцяюче :-)
Лоран Джегу

Я спробував подвійний похідний метод Собеля, який ви описуєте в дисертації, на обмеженій тестовій зоні, і це дуже цікаво! Ясне міське ядро ​​є ізольованими, зневіреними дуже різними значеннями щільності. Велике спасибі :) До речі, я використовував безкоштовне програмне забезпечення з відкритим кодом для обчислення рівнянь та растрової математики: Opticks.
Лоран Джегу

Мірило штучного світла було б хорошим проксі для міських умов. Пошук у Google має знайти приклади досліджень.
b_dev

@indiehacker - Я дивився на це, але це залежить від культури, Франція, наприклад, набагато темніше, ніж Великобританія.
Ян Тертон

6

З точки зору густоти населення, "міська територія", як правило, повинна задовольняти лише деяким аксіоматичним критеріям :

  1. Її межа не повинна включати жодних точок (відносно) високої щільності порівняно з максимальною щільністю в її внутрішніх просторах.

  2. Він повинен бути просто з'єднаний (ніяких «дірок»).

  3. Його середня щільність населення повинна перевищувати деякий попередньо визначений поріг.

Аксіома (1) є найбільш природною: якби гранична точка мала високу щільність, ми просто перемістимо межу назовні, щоб включити цю точку в міську зону. Я хотів би припустити, що "відносний" означає максимум пропорції , наприклад, десяту чи одну соту або будь-яку іншу . Аксіома (2) дозволяє уникнути виключення парків та інших регіонів низької щільності, які природним чином зустрічаються у містах. Аксіома (3) , яка через залежність від порогу є дещо довільною, виключає невеликі компактні села.

Насправді існує хоча б ще один елемент довільності: будь-яка сітчаста карта густини населення неявно в середньому включає населення по місцевих мікрорайонах (рівний одній клітині в деяких випадках і дорівнює радіусу ядра для оцінки щільності ядра). Давайте приймемо цей неявний розмір сусідства (який можна змінити за допомогою першого запуску фокусних засобів або інших згладжувань ядра над початковою картою щільності), цей поріг сукупності та відчуття "відносно високого" в аксіомі 1 як налаштовані користувачем параметри, які керують результат.

Ці аксіоми, природно, ведуть до досить простого алгоритму : треба знаходити локальні максимуми, шукати їхні квартали, поки не буде виявлено, що межа задовольняє аксіому (1), заповнити будь-які діри для задоволення аксіоми (2), а потім екранувати всі такі області кандидат відповідно до (3). Робиться це так:

  1. За бажанням розгладьте карту щільності.

  2. Виконайте алгоритм «заливки» на карті, пов’язаній із щільністю (див. Нижче).

  3. RegionGroup результат.

  4. Видаліть отвори з багатокутників RegionGrouped.

  5. Виконайте зональні суми густоти населення над заповненими полігонами.

  6. Усуньте будь-які багатокутники, що мають суми (або середню густину) нижче межі популяції (щільності).

Що залишилося - це ваше рішення.

Дозвольте сказати трохи більше про крок (1), який є ключовим. Алгоритм заповнення ідентифікує "раковини" і "заповнює" їх до постійної кількості, що перевищує їх висоти. Це саме те , що Аксіома (1) просить нас зробити, за умови, що (а) ми можемо змусити «раковину» відігравати роль «локального максимуму» і (б) зробити «постійну кількість вище» відігравати роль «постійної частки . " Спосіб це зробити, заповнивши негативний логарифм щільностіа не сама щільність. (Додайте спочатку крихітну константу до щільності - скажімо, близько 0,1 людини на квадратний кілометр - перед тим, як взяти журнал, щоб будь-які клітини, що містять нулі, не спричинили проблем.) "Озера" в негативній щільності журналу визначають кандидата міські райони. У вас ще є три незалежні параметри, з якими можна грати (введення на кроках 0, 1 і 5); їх встановлення потребує певної думки про те, що ви насправді маєте на увазі під «міською територією», а також експерименти.


Дякуємо за детальну відповідь. Я спробую знайти потрібні програмні засоби (або запрограмувати їх) для тестування алгоритму заливки негативним журналом, що здається гарним результатом.
Лоран Джегу
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.