Оновлення: Суть проблеми полягає в тому, що для досягнення часової складності потрібно в порядку зберігання .O ( n журнал( n ) )O ( n )
Ні, - нижня теоретична межа часової складності (див. (1)) вибору елемента серед усіх можливо .O ( n журнал( n ) )k t h n ( n - 1 )кт годn ( n - 1 )2| хi- хj| :1≤i<j≤n
Ви можете отримати простір , але лише наївно перевіривши всі комбінації в часі .O ( 1 )хi- хjО ( н.)2)
Хороша новина полягає в тому, що ви можете використовувати оцінювач масштабу (див. (2) та (3) для вдосконаленої версії та деякі порівняння часу), реалізований у функції
в пакеті . Уніваріантний оцінювач - це двоетапний (тобто повторно зважений) оцінювач масштабу. Він має 95-відсоткову ефективність Гаусса, 50-відсоткову точку розбиття, а також складність часу та простору (плюс це можна легко зробити "в Інтернеті", знищивши половину обчислювальних витрат при повторному використанні - хоча ви доведеться викопати код, щоб реалізувати цю опцію, це зробити досить просто).ττ O ( n ) O ( 1 )scaleTau2()
R
robustbase
τO ( n )O ( 1 )R
- Складність вибору та ранжирування у X + Y та матриць із відсортованими колонками GN Frederickson and DB Johnson, Journal of Computer and System Sciences том 24, випуск 2, квітень 1982, стор 197-208.
- Йохай, В. і Замар, Р. (1988). Високі оцінки точки регресу за рахунок мінімізації ефективної шкали. Журнал Американської статистичної асоціації 83 406–413.
- Maronna, R. and Zamar, R. (2002). Надійні оцінки місця розташування та дисперсії для великомірних наборів даних. Технометрія 44 307–317
Редагувати Для використання цього
- Загоріть
R
(це безкоштовно і його можна завантажити тут )
- Встановіть пакет, ввівши:
install.packages("robustbase")
- Завантажте пакет, ввівши:
library("robustbase")
- Завантажте файл даних і запустіть функцію:
mydatavector <- read.table("address to my file in text format", header=T)
scaleTau2(mydatavector)