Я роблю аналіз Matlab на даних МРТ, де я провів PCA на матриці розміром 10304x236, де 10304 - кількість вокселів (вважайте їх пікселями), а 236 - кількість часових точок. PCA дає мені 236 власних значень та пов'язаних з ними коефіцієнтів. Це все добре. Однак, коли настав час вирішити, скільки компонентів потрібно зберегти, документ, який я копіюю, говорить наступне (будь ласка, повідомте мене, чи потрібне уточнення, оскільки це лише коротка частина всього документу):
Потім ми виконали моделювання в Монте-Карло, щоб визначити кількість основних компонентів (ПК), які слід витягнути з неприємних ROI даних для кожного сканування. Нульовий розподіл очікуваних власних значень генерувався окремо для даних кодування та спокою для кожного суб'єкта, виконуючи PCA на нормально розподілених даних, рівних за рівнем даних про ROI кодування та спокою. Комп'ютери з даних справжньої неприємності ROI були потім обрані для даного сканування спокою або кодування, якщо їх асоційовані власні значення перевищували 99-й довірчий інтервал власних значень із симуляцій Монте-Карло.
Я абсолютно не маю уявлення, що тут робити. Я звик обирати компоненти, виходячи із поясненої сукупної дисперсії. Я думаю, що це:
Потім ми виконали моделювання в Монте-Карло, щоб визначити кількість основних компонентів (ПК), які слід витягнути з неприємних ROI даних для кожного сканування.
Синтез Монте-Карло просто означає зробити наступні 1000 (чи такі) рази, правда?
Нульовий розподіл очікуваних власних значень був сформований при виконанні PCA на звичайно розподілених даних, рівних за рівнем рентабельності кодування та рентабельності спокою.
По-перше, я припускаю, що "рівний ранг" в основному означатиме, що я буду створювати матрицю такого ж розміру, що й оригінал (10304x236). З точки зору "нормально розподілених даних рівного рангу" ... це означає, що я повинен створити матрицю 10304x236 випадкових чисел із звичайного розподілу? Matlab має функцію під назвою 'normrnd', яка робить це, але вимагає введення mu і sigma. Чи використовую я ті ж му та сигми, що й ті, що отримані з початкового набору даних? Це більше чи менше, що означає "очікувані власні значення", оскільки я не маю уявлення про те, як виглядатиме розподіл ОЧЕКОВАНИХ власних значень.
Я думаю, моя проблема більш-менш те, що я не знаю, як зробити "нульовий розподіл" власних значень.