Нульові значення в географічно зваженому регресійному аналізі


12

Деякі мої пояснювальні змінні мають кілька нульових значень для певних многокутників.

Чи може географічно зважений регресійний аналіз обробляти їх, або я повинен видалити цілий многокутник і всі дані (залежні та незалежні змінні для цього конкретного багатокутника)?


Що представляють ці нулі? Що значення не застосовується чи воно існує, але невідомо? Якщо останні, чому це невідомо? (Основна проблема полягає в тому, чи невідома причина пов’язана з якоюсь величиною; наприклад, якщо ви вивчаєте гідрологію та використовуєте земельний покрив як пояснювальну змінну, то якщо земельний покрив невідомий через повені, це важлива інформація і означає набагато більше, ніж просто пропущене значення.)
whuber

1
Дякую вам, деякі з нулів представляють дані, які були опущені для конфіденційності через невеликі одиниці агрегації, інші просто були недоступні, але не в результаті пояснювальних змінних, що впливають на інші варіації. У мене є справжні нульові значення, згідно з якими нуль не представляє події / швидкості для цього конкретного багатокутника, а також у мене є деякі нульові значення, де дані відсутні. Оскільки у мене є близько 29 пояснювальних змінних для початку, якщо я вийму багатокутники, де для рядків, що містять нулі, я втрачаю 8 багатокутників з 279, і я сподівався, що мені цього не доведеться. Дякую!
I серце б’ється

Я радий, що у вас є інформація та теорії про відсутність. Можливо, ви хочете бути обережними щодо цих малих одиниць, тому що значення майже будь-якої змінної, можливо, можуть бути пов'язані з розміром регіону, який вона представляє, створюючи тим самим потенційне зміщення у шаблоні відсутності.
whuber

2
Ви можете включити нулі, ввівши змінні, щоб вказати на їх присутність та кодувати всі вихідні нульові результати загальним значенням (яке значення ви обрали насправді не має значення). Вам знадобиться один окремий показник для кожної змінної, який містить будь-які нулі. Що б ви не робили, не замінюйте просто нулі нулями (або будь-якими іншими константами)! Нуль означає щось зовсім інше, ніж нуль.
whuber

1
@whuber Схоже, що у ваших коментарях може бути достатньо, щоб написати відповідь на це.
PolyGeo

Відповіді:


1

Ви можете спробувати відгадати значення "null" з навколишніх даних. Це було б краще, ніж залишати їх поза межами, тому що таким чином ви не будете втрачати дані. Звичайно, ви повинні бути обережними у тому, як ви здогадуєтесь про значення. Тому що якщо ваша здогадка буде упереджена, ваша модель також буде.

дивіться також: http://handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

і:

Обережно:

Кожного разу при використанні форм-файлів пам’ятайте, що вони не можуть зберігати нульові значення. Інструменти або інші процедури, які створюють файли форми з входів нефайлових файлів, можуть, таким чином, зберігати нульові значення як нульові або як деяке дуже мале від’ємне число (-DBL_MAX = -1,7976931348623158e + 308). Це може призвести до несподіваних результатів. Дивіться також: Міркування щодо геообробки для виводу форм файлів. ( http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm )

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.