Способи вирішення функції довготи / широти [закрито]


19

Я працюю над вигаданим набором даних з 25 функціями. Дві особливості - це широта та довгота місця, а інші - значення pH, висота, швидкість руху вітру тощо тощо з різними діапазонами. Я можу виконати нормалізацію щодо інших функцій, але як я підходжу до ознак широти / довготи?

Редагувати: Це проблема передбачення врожайності сільського господарства. Я думаю, що Lat / long є дуже важливим, оскільки місця можуть бути життєво важливими для прогнозування, а отже, і для дилеми.


Чи можете ви пояснити, чому ви не вважаєте, що можете нормалізувати ці функції? Імовірно, вони чисельні так само, як і інші функції, тож ви можете взяти mean / sd? Ви стурбовані наявністю природного виміру відстані між місцями? Якщо так, то чи охоплюють дані невелику область (з подібними значеннями) чи глобальні?
Ніл Слейтер

@NeilSlater Просто інтуїтивно не має сенсу нормалізувати ці функції. Чи не буде втрачена інформація, якщо її нормалізувати? У мене є набір даних, що охоплюють округи Америки.
AllThingsScience

Яка інформація, на вашу думку, буде втрачена? Це, мабуть, насправді не загубиться, але якщо ви поясните у своєму питанні, що вас хвилює, хтось зможе відповісти. Не знаючи більше, я просто нормалізував би незалежно - для повністю глобальних значень та деяких проблем (де відстань між точками важливий) я міг би створити функцію 3d декартових координат з long / lat.
Ніл Слейтер

Яке тут ваше запитання? Що ви намагаєтесь з’ясувати з даних? Кореляція? Скупчення? Класифікація? Прогноз? Інтерполяція? Яке місце важливе для вашої моделі?
Розміщений

@Spacedman Будь ласка, дивіться редагування.
AllThingsScience

Відповіді:


24

Широкі координати довгих задач мають те, що вони є двома ознаками, які представляють тривимірний простір. Це означає, що довга координата йде навколо, а це означає, що два найбільш екстремальних значення насправді дуже близькі між собою. Я декілька разів займався цією проблемою, і те, що я роблю в цьому випадку, - це зіставити їх на координати x, y і z. Це означає, що близькі точки в цих трьох вимірах також близькі в реальності. Залежно від випадку використання ви можете знехтувати змінами висоти і віднести їх до ідеальної сфери. Ці функції можна потім нормально стандартизувати.

Для уточнення (узагальненого з коментарів):

x = cos(lat) * cos(lon)
y = cos(lat) * sin(lon), 
z = sin(lat) 

1
Це дуже цікаво. Дякую! Чи можете ви підтвердити, чи це формули для перетворення? x = R * cos (lat) * cos (lon), y = R * cos (lat) * sin (lon), z = R * sin (lat)
AllThingsScience

На даний момент у мене немає доступу до коду, але він виглядає правильно. Вам не потрібен R, оскільки ви все одно будете стандартизувати;)
Ян ван дер Вегт

Ідеально! Дякую.
AllThingsScience
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.