Простір даних, змінний простір, простір спостереження, простір моделі (наприклад, в лінійній регресії)


9

Припустимо, маємо матрицю даних , яка -by- , і вектор мітки , який -by-one. Тут кожен рядок матриці є спостереженням, і кожен стовпець відповідає розмірності / змінній. (припустимо )XnpYnn>p

Тоді що data space, variable space, observation space, model spaceзначить?

Чи простір, що охоплюється вектором стовпців, є (виродженим) -D простором, оскільки він має координат, будучи рангом , називається змінним простором, оскільки його охоплюють змінним вектором? Або називається простором спостереження, оскільки кожен вимір / координата відповідає спостереженню?nnp

А як щодо місця, що охоплюється векторами рядків?


5
Це не загальновідомі терміни. У вас є довідник? Якщо ні, ми можемо здогадатися, що вони мають на увазі.
whuber

1
У мене немає довідки. Я колись чув, як мій професор сказав це деякий час тому.
користувач3813057

3
Я майже впевнений, що ваш професор у певний момент визначив ці терміни. Можливо, вони є у ваших конспектах класу ....
whuber

Відповіді:


14

Ці терміни з'являються в деяких книгах з багатовимірної статистики. Припустимо, у вас є nособи за pматрицею даних про кількісні характеристики. Тоді ви можете побудувати особи як точки в просторі, де є особливості осей. Це буде класичний розсіювач, відомий також сюжетним змінним простором . Ми говоримо, що хмара людей охоплює простір, визначений осями-ознаками.

Ви також можете уявити розсип, з точки зору змінних, а осі - особи. Абсолютно, як і попередні, тільки топси-вигнуті. Це буде предметний космічний сюжет (або графік простору спостереження) зі змінними, що охоплюють його, особами, які його визначають.

Зауважте, що якщо (як часто), n>pто у другому випадку лише деякі pрозміри з nрозмірів не надмірні; це означає, що ви можете і можете малювати pзмінні точки на p-вимірному графіку . Також за традицією змінні точки зазвичай пов'язані з походженням, і тому вони постають як вектори (стрілки). Ми використовуємо предметне представлення простору здебільшого для показу зв’язків між змінними, тому для зручності ми опускаємо осі-предмети та зображуємо точки як стрілки.1

Якщо функції (стовпці матриці даних) були зосереджені перед малюванням предметного простору, то косинуси кутів між змінними векторами дорівнюють їх співвідношенням Пірсона, тоді як довжина вектора дорівнює нормам змінних (коренева сума квадратів ) або стандартні відхилення (якщо їх розділити на df ).

Змінений простір і предметний простір - це дві сторони однієї і тієї ж монети, вони є тим самим евклідовим аналітичним простором, представлені лише дзеркально один одному. Вони поділяють ті самі властивості, як ненульові власні значення та власні вектори. Тому можна побудувати як об'єкти, так і змінні поруч як точки в просторі головних осей (або іншої ортогональної основи) цього аналітичного простору, - цей спільний сюжет називається біплотом . Я точно не знаю, що означає термін "простір даних" - якщо він означає щось конкретне, то я вважаю, що це спільний аналітичний простір, з якого предметний простір і простір змінних є двома іпостасями.

введіть тут опис зображення

Деякі локальні посилання:


1 Уявіть, що у вас є n=5індивіди та p=2змінні, і вам якимось чином вдалося магічним чином намалювати 2 точки у 5-мірному просторі. Тоді ви можете обертати підпростір, визначений будь-якою з 2 осей, таким чином, щоб він вбудовував 2 точки (які, таким чином, відкидають цю площину відтепер); після неї ви сміливо скидаєте інші 3 осі (розміри), оскільки вони стали непотрібними. Зберігалося положення двох змінних точок відносно один одного.


2
+1. Але я не впевнений, який саме математичний сенс говорити про те, що змінна та предметний простір - це "той самий евклідовий аналітичний простір".
амеба

3
@amoeba, не будучи математичним у відповіді, я сподівався, що це інтуїтивно зрозуміло (особливо для експертів лінійної алгебри, як ви). Наприклад, у розкладі сингулярного значення матриці даних (svd, на якому базується біплот) - який простір характеризують власні значення та лівий і правий власні вектори? Хіба це не той самий аналітичний простір, який можна було б розкласти різними способами, - серед яких (i) рядки та стовпці як точки головних осей, як осі; (ii) рядки як точки, стовпці як осі; (iii) стовпці як точки, рядки як осі?
ttnphns
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.