У цій публікації ви можете прочитати заяву:
Моделі зазвичай представлені точками на кінцевому розмірному колекторі.
Щодо диференціальної геометрії та статистики Майкла К. Мюррея та Джона У Райса, ці поняття пояснюються в прозовій формі, читаючи навіть ігноруючи математичні вирази. На жаль, ілюстрацій дуже мало. Те саме стосується цієї публікації в MathOverflow.
Я хочу попросити допомогти з візуальним поданням, яке послужить картою або мотивацією до більш формального розуміння теми.
Які точки на колекторі? Ця цитата з цієї інтернет-знахідки , здавалося б, вказує на те, що це можуть бути або точки даних, або параметри розподілу:
Статистика на багатовидах та геометрії інформації - це два різні способи, коли диференціальна геометрія відповідає статистиці. У той час як у статистиці про багатоманіття це дані, які лежать на багатоманітнику, в геометрії інформації дані знаходяться в , але параметризоване сімейство функцій щільності ймовірності, що представляє інтерес, трактується як різноманіття. Такі багатоманітники відомі як статистичні множини.
Я намалював цю діаграму, натхненну цим поясненням дотичного простору тут :
[ Редагувати, щоб відобразити коментар нижче про : ] У колекторі дотичний простір - це набір усіх можливих похідних ("швидкостей") у точці пов'язаній з кожна можлива крива на колекторі, що проходить черезЦе можна розглядати як набір карт з кожної кривої, що проходить через тобто визначений як композиція , з що позначає криву (функція від реальної лінії до поверхні колектораp∈ M (ψ: R → M )p. p, C ∞ (t)→ R , ( f ∘ ψ ) ′ (t)ψ M p,), що проходить через точку і зображений червоним кольором на схемі вище; і представляє тестову функцію. Білі контурні лінії "iso- " відображають в ту саму точку на реальній лінії та оточують точку .f p
Еквівалентність (або одна з еквівалентів, застосованих до статистики) обговорюється тут і стосується наступної цитати :
Якщо простір параметрів для експоненціального сімейства містить одномірне відкрите безліч, то воно називається повним рангом.
Експоненціальна сім'я, що не має повного рангу, зазвичай називається вигнутою експоненціальною сім'єю, оскільки зазвичай простір параметрів є кривою в розміром менше s.
Це, мабуть, робить інтерпретацію сюжету таким чином: параметри розподілу (в даному випадку сімейства експоненціальних розподілів) лежать на колекторі. Точки даних у будуть відображати лінію на колекторі через функцію у випадку задачі про нелінійну оптимізацію з дефіцитним рангом. Це було б паралельним обчисленням швидкості у фізиці: пошук похідної функції по градієнту ліній "iso-f" (похідна спрямованого помаранчевим кольором):Функція відіграватиме роль оптимізації вибору параметра розподілу як кривої ψ : R → M f ( f ∘ ψ ) ′ ( t ) . f : M → R ψ fрухається по контурних лініях на колекторі.
Передумови додані:
Слід зазначити, що я вважаю, що ці поняття не одразу пов'язані з нелінійним зменшенням розмірності ML. Вони схожі на геометрію інформації . Ось цитата:
Важливо, що статистика щодо колекторів сильно відрізняється від багатозначного навчання. Останнє є галуззю машинного навчання, де метою є вивчення прихованого багатообраза з даних, оцінених . Як правило, розмірність шуканого латентного багатообразника менше . Латентний колектор може бути лінійним або нелінійним, залежно від конкретного використовуваного методу. n
Наступна інформація з статистики на многовидах з додатками до моделювання Shape Деформації по Орен Freifeld :
У той час як , як правило , нелінійний, можна зіставити дотичний простір, що позначається , в кожну точку . векторний простір, розмірність якого та ж, що і . Походження знаходиться на . Якщо вбудований у якийсь евклідовий простір, ми можемо вважати як афінним підпростором таким чином: 1) він торкається у ; 2) принаймні локально, лежить повністю на одній із його сторін. Елементи TpM називаються дотичними векторами.T p M p ∈ M T p M M T p M p M T p M M p M
[...] На колекторах статистичні моделі часто виражаються в дотичних просторах.
[...]
[Ми вважаємо два] набори даних складаються з точок у :
;
Нехай і є два, можливо , невідомо, точки в . Передбачається, що два набори даних відповідають наступним статистичним правилам: M
{ log μ S ( q 1 ) , ⋯ , log μ S ( q N S ) } ⊂ T μ S M ,
[...]
Іншими словами, коли виражається (як дотичні вектори) в дотичному просторі (до ) в , це може розглядатися як набір зразків з нульового середнього Гаусса з коваріацією . Так само, коли виражається в дотичному просторі в це може розглядатися як набір iid-зразків від нульового середнього Гаусса з коваріацією . Це узагальнює випадок Евкліда. M µ L Σ L D S μ S Σ S
У цій же довідці я знаходжу найближчий (і практично єдиний) приклад цієї графічної концепції в Інтернеті, про яку я прошу:
Чи вказувало б це, що дані лежать на поверхні колектора, виражених дотичними векторами, а параметри будуть відображені на декартовій площині?