це питання почалося як " Кластеризація просторових даних у R " і тепер перейшло до питання DBSCAN.
Оскільки відповіді на перше запитання запропонували, я шукав інформацію про DBSCAN та читав деякі документи. Виникли нові запитання.
DBSCAN вимагає деяких параметрів, один з них - "відстань". Оскільки мої дані є тривимірними, довготою, широтою та температурою, яку "відстань" я повинен використовувати? який вимір пов'язаний з цією відстані? Я думаю, що це повинна бути температура. Як знайти таку мінімальну відстань за допомогою R?
Ще один параметр - мінімальна кількість точок, необхідних для формування кластера. Чи є якийсь спосіб знайти це число? На жаль, я не знайшов.
Шукаючи Thorugh Google, я не міг знайти приклад R для використання dbscan у наборі даних, подібних до мого, ви знаєте який-небудь веб-сайт із подібними прикладами? Тож я можу читати і намагатися адаптуватися до своєї справи.
Останнє питання полягає в тому, що моя перша спроба R з DBSCAN (без належної відповіді на попередні запитання) призвела до проблеми з пам'яттю. R каже, що не може виділити вектор. Я починаю з 4-кілометрової сітки з 779191 балами, яка закінчується приблизно в 300000 рядків x 3 стовпчики (широта, довгота та температура) при видаленні недійсних точок SST. Будь-який натяк на вирішення цієї проблеми з пам'яттю. Це залежить від мого комп'ютера чи від самого DBSCAN?
Дякуємо за терпіння, щоб прочитати довге і, мабуть, нудне повідомлення та за вашу допомогу.