Як побудувати квадрати для точкових процесів, які сильно відрізняються за частотою?


9

Я хочу здійснити аналіз лічильника квадрата на декількох точкових процесах (або одному позначеному точковому процесі), щоб потім застосувати деякі методи зменшення розмірності.

Мітки не однаково розподілені, тобто деякі знаки з’являються досить часто, а деякі досить рідко. Таким чином, я не можу просто розділити 2D-простір на звичайній сітці, тому що більш часті позначки "переповнюють" менш часті, маскуючи їх зовнішній вигляд.

Таким чином, я спробував побудувати свою сітку таким чином, щоб кожна клітинка мала не більше N точок у ній (для цього я просто розділяю кожну клітинку на чотири менші (і однаково розміри) комірки, рекурсивно, поки жодна клітина не має більше N точок у це).

Що ви думаєте про цю техніку «нормалізації»? Чи є стандартний спосіб робити такі речі?


1
Якщо ви використовуєте звичайну сітку і частіші позначки перевищують менш часті, я не бачу, як це "переповнює" і "маскує" речі. Не могли б ви трохи допрацювати? Чи намагаєтесь ви замінити вміст кожного квадрату лише найпоширенішим знаком чи чимось подібним?
Уейн

Відповіді:


1

Я використовував квадратовий аналіз лише на звичайних сітках. Це було корисно щодо мети, яка полягала в порівнянні дисперсії даних вибірки з відомим процесом, наприклад, випадковим. Тому звичайна сітка спрацювала добре.
Розроблений та описаний метод не обов'язково підраховує квадрати. Наприклад, у методі ковзаючої середньої величини, одним із варіантів є підрахунок кількості сусідів для процесу, тобто усереднення, яке просто робиться шляхом пошуку в колі (у 2D) або сфері (у 3D). Ваш метод схожий із дещо іншим використанням цих обраних зразків.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.