У мене є набір щомісячних даних про температуру поверхні моря (SST), і я хочу застосувати певну методологію кластеру для виявлення регіонів з подібними моделями SST. У мене є набір щомісячних файлів даних, що працюють з 1985 по 2009 рік, і я хочу застосувати кластеризацію до кожного місяця як перший крок.
Кожен файл містить сітчасті дані для 358416 точок, де приблизно 50% є землею та позначені значенням 99,99, яке буде NA. Формат даних:
lon lat sst
-10.042 44.979 12.38
-9.998 44.979 12.69
-9.954 44.979 12.90
-9.910 44.979 12.90
-9.866 44.979 12.54
-9.822 44.979 12.37
-9.778 44.979 12.37
-9.734 44.979 12.51
-9.690 44.979 12.39
-9.646 44.979 12.36
Я спробував метод кластеризації CLARA і отримав деякі, мабуть, непогані результати, але мені також здається, що це просто згладжування (групування) ізоліній. Тоді я не впевнений, що це найкращий метод кластеризації для аналізу просторових даних.
Чи існує якийсь інший метод кластеризації, присвячений цьому типу наборів даних? Деякі посилання було б добре почати читати.
Заздалегідь спасибі.