Модель оцінки щільності населення


14

База даних (населення, площа, форма) може бути використана для відображення щільності населення шляхом призначення постійної величини населення / площі для кожної форми (що є полігоном, таким як блок перепису, урочище, округ, штат тощо). Однак населення, як правило, не розподілено рівномірно у межах своїх полігонів. Дасиметричне відображення - це процес уточнення цих оцінок щільності за допомогою допоміжних даних. Це важлива проблема в соціальних науках, як свідчить цей останній огляд .

Припустимо, тоді ми маємо доступну допоміжну карту земельного покриву (або будь-якого іншого дискретного чинника). У найпростішому випадку ми можемо використовувати очевидно нежилі райони, такі як водні тіла, щоб окреслити там, де населення не є, і, відповідно, віднести все населення до решти районів. Більш загально, кожна одиниця перепису вирізана на ділянках, що мають площі поверхні , . Таким чином, наш набір даних доповнено до списку кортежівk x j i i = 1 , 2 , , kjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

де - сукупність (припускається, вимірюється без помилок) в одиниці і - хоча це не так строго - ми можемо вважати, що кожен також точно вимірюється. У цих умовах мета полягає у розподілі кожного на суму j x j i y jyjjxjiyj

yj=zj1+zj2++zjk

де кожен і оцінює сукупність в одиниці проживає в класі . Оцінки повинні бути неупередженими. Цей розділ уточнює карту щільності населення шляхом призначення щільності перетину полігону перепису та класу покривного покриву . z j i j i z j i / x j i j thzji0zjijizji/xjijthith

Ця проблема відрізняється від стандартних параметрів регресії помітними способами:

  1. Розбиття кожного повинно бути точним. yj
  2. Компоненти кожного розділу повинні бути негативними.
  3. Жодна з даних (за припущенням) не має помилок: усі підрахунки населення а всі області є правильними. x j iyjxji

Існує багато підходів до рішення, наприклад, методу " інтелектуального дасиметричного картографування ", але всі, про кого я читав, мають спеціальні елементи та очевидний потенціал упередженості. Я шукаю відповіді, які пропонують творчі, обчислювані статистично методи. Безпосередня заявка стосується колекції c. - Переписні одиниці в середньому 40 чоловік на рік (хоча значна частина має 0 осіб) і близько десятка класів земельного покриття. 10 6105106


Виправлена ​​проблема форматування. Це була помилка.
Роб Хайндман

@Rob Дякую, і дякую всім людям, які переглянули це: я побачив ваші коментарі, перш ніж вони були видалені, і я вдячний за ваші зусилля.
whuber

1
Також цей: П. А Зандберген та Д. А Ігніціо, “Порівняння методів дасиметричного картографування для малих оцінок населення”, “Картографія та наука про географічну інформацію” 37, вип. 3 (2010): 199–214. ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/… Що, здається, вимагає змішування.
fgregg

1
Цей документ може бути корисним: Хваван Кім та Сяобай Яо, «Переглянута пікнофілактична інтерполяція: інтеграція з методом дасиметричного картографування», Міжнародний журнал дистанційного зондування 31, вип. 21 (2010): 5657. informaworld.com/10.1080/01431161.2010.496805
fgregg

1
Ви знаєте, дасиметричне відображення в кінцевому рахунку як проблема екологічного висновку. Недавня робота К. Імай може бути корисною: pan.oxfordjournals.org/content/16/1/41.abrief
fgregg

Відповіді:


4

Можливо, ви захочете перевірити роботу Мітчела Ленгфорда над дазиметричним картографуванням.

Він будує растри, що представляють розподіл населення Уельсу, і деякі його методологічні підходи можуть бути корисні тут.

Оновлення: Ви також можете ознайомитися з роботою Джеремі Менніса (особливо ці дві статті).


2
Дякую. Ця робота дає вказівку на павутину останніх досліджень дозиметричного картографування.
whuber

2

Цікаве запитання. Ось орієнтовний результат наближення до цього із статистичного ракурсу. Припустимо, ми придумали спосіб присвоїти кількість населення кожній області . Позначте це співвідношення як нижче:xji

zji=f(xji,β)

Зрозуміло, що будь-яка функціональна форма, яку ми нав'язуємо Буде в кращому випадку наближенням до реального співвідношення, а отже, і необхідністю включення помилок у вищенаведене рівняння. Таким чином, вищезазначене стає:f(.)

zji=f(xji,β)+ϵji

де,

ϵjiN(0,σ2)

Припущення про розподільну помилку на терміні помилки є ілюстративними цілями. При необхідності ми можемо змінити це за необхідності.

Однак нам потрібне точне розкладання . Таким чином, нам потрібно накласти обмеження на умови помилки та функцію Як показано нижче:yjif(.)

iϵji=0

if(xji,β)=yj

Позначимо складений вектор через а складені детерміновані умови через . Таким чином, ми маємо: z jzjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

де,

e - вектор відповідних розмірів.

Перше обмеження індикатора фіксує думку про те, що сума детермінованих термінів повинна а друга - фіксує думку про те, що залишкові помилки повинні дорівнювати 0.yj

Вибір моделі складніший, оскільки ми точно розкладаємо спостережуване . Можливо, способом підходу до вибору моделі є вибір моделі, яка дає найменшу дисперсію помилок, тобто ту, яка дає найнижчу оцінку .yjσ2

Редагуйте 1

Думаючи про щось вище, вищевказану рецептуру можна спростити, оскільки вона має більше обмежень, ніж потрібно.

zji=f(xji,β)+ϵji

де,

ϵjiN(0,σ2)

Позначимо складений вектор через а складені детерміновані умови через . Таким чином, ми маємо: z j f ( x j i , β ) fzjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

де,

e - вектор відповідних розмірів.

Обмеження на забезпечує точне розкладання.zj


2
@Srikant Дякую Я думав по схожим принципам, коли я ставив питання, і з тих пір випробував GLM (пуассонівський розподіл з лінійною ланкою), а також деякі інші моделі. На жаль, зараз схоже, що будь-яка модель, що базується виключно на типі покриття та пропорції, не спрацює: зразок цих даних свідчить про те, що структури населення залежать від більшого просторового контексту. Як мінімум, тоді нам потрібно було б включити в лінійну модель просторово відсталі коваріати.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.