Запитання з тегом «high-dimensional»

Відноситься до великої кількості функцій або розмірів (змінних) даних. (Для великої кількості точок даних використовуйте тег [big-data]; якщо проблема - більша кількість змінних, ніж дані, використовуйте тег [underdetermined].)

2
Оцінка невизначеності у великомірних задачах висновку без вибірки?
Я працюю над великомірною задачею висновку (близько 2000 параметрів моделі), для якої ми можемо надійно виконати оцінку MAP, знайшовши глобальний максимум журналу заднього за допомогою комбінації оптимізації на основі градієнта та генетичного алгоритму. Я дуже хотів би мати можливість зробити деяку оцінку невизначеностей щодо параметрів моделі на додаток до знаходження …

1
Як дітям вдається зібрати батьків у проекції PCA набору даних GWAS?
Візьміть 20 випадкових точок у 10-мірному просторі з кожною координатною лінією від N( 0 , 1 )N(0,1)\mathcal N(0,1). Розділіть їх на 10 пар ("пари") і додайте до набору даних середнє значення кожної пари ("дитина"). Потім зробіть PCA на отриманих 30 очках і побудуйте графік PC1 проти PC2. Відбувається чудова річ: …

1
Виявлені високомірні, співвідносні дані та основні характеристики / коваріати; тестування множинних гіпотез?
У мене є набір даних з близько 5000 часто співвідносних функцій / коваріатів та двійкової відповіді. Дані мені дали, я не збирав їх. Я використовую Lasso і градієнтний прискорення для створення моделей. Я використовую ітераційну, вкладену перехресну перевірку. Я повідомляю про найбільші (абсолютні) коефіцієнти 40 Лассо та 40 найважливіших особливостей …

3
PCA занадто повільний, коли обидва n, p великі: Альтернативи?
Налаштування проблеми У мене є точки даних (зображення) високого розміру (4096), які я намагаюся візуалізувати у 2D. З цією метою я використовую t-sne таким чином, як у наведеному нижче прикладі коду Карпаті . Документація scikit-learn рекомендує використовувати PCA, щоб спочатку зменшити розмірність даних: Настійно рекомендується використовувати інший метод зменшення розмірності …

7
Знайдіть близькі пари у дуже великому просторі з розрідженими векторами
Я маю NNN(~ мільйон) функціональних векторів. ІснуєMMM (~ мільйон) двійкових функцій, але лише в кожному векторі KKK (~ тисяча) з них було б 111, решта є 000. Я шукаю пари векторів, які мають хоча бLLL (~ сотня) спільних ознак (111в обох). Кількість таких пар має аналогічну величинуNNN (~ мільйон). Я …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.