Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

2
Коли t-SNE вводить в оману?
Цитуючи одного з авторів: t-Розподілене стохастичне сусідське вбудовування (t-SNE) - це ( виграшний ) метод зменшення розмірності, який особливо добре підходить для візуалізації високомірних наборів даних. Так це звучить досить чудово, але це той, хто говорить Автору. Ще одна цитата автора (ре: вищезгаданий конкурс): Що ви зняли з цього змагання? …

7
Чому регуляризація не вирішує голод щодо даних Deep Neural Nets?
Проблема, яку я часто зустрічався в контексті Нейронних мереж в цілому, і Глибоких нейронних мереж, зокрема, полягає в тому, що вони "голодні", тобто вони не працюють добре, якщо у нас не є великий набір даних з якою тренувати мережу. Я розумію, що це пов’язано з тим, що NNets, особливо Deep …

3
Чи має ознака балів чи навантажень в PCA чи FA значення? Чи можу я перевернути знак?
Я провів аналіз основних компонентів (PCA) з R, використовуючи дві різні функції ( prcompі princomp), і зауважив, що бали PCA відрізняються за ознакою. Як це може бути? Врахуйте це: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 [6,] 0.481756 …
37 r  pca  factor-analysis 

4
Різниця між прогнозом і прогнозом?
Мені було цікаво, яка різниця та залежність між прогнозом та прогнозуванням? Особливо в часових рядах та регресії? Наприклад, чи я правильний: У часових рядах прогнозування, схоже, означає оцінку майбутніх значень з урахуванням минулих значень часового ряду. У регресії прогноз, здається, означає оцінити значення, чи є це майбутніми, поточними або минулими …

3
Тестування гіпотез Bootstrap vs. permutation
Існує кілька популярних методів перестановки, які часто використовуються на практиці, такі як завантажувальний запуск, перестановка на перестановку, джекніф і т. Д. Існують численні статті та книги, які обговорюють ці методи, наприклад , тести перестановки, параметричні та завантажувальні функції «Філіпп I хороший» (2010). Гіпотези Моє запитання, яка техніка перекомпонування отримала більшу …

2
Розуміння параметрів усередині негативного біноміального розподілу
Я намагався відповідати моїм даними в різні моделі і з'ясував , що fitdistrфункція з бібліотеки MASSз Rдає мені , Negative Binomialяк найбільш підходяще. Тепер на сторінці wiki визначення задано як: Розподіл NegBin (r, p) описує ймовірність k провалів і r успіхів у k + r випробуваннях Бернуллі (p) з успіхом …

5
Перехресний аналіз часових рядів
Я використовував пакет карети в R для побудови прогнозних моделей для класифікації та регресії. Caret надає уніфікований інтерфейс для налаштування гіпер-параметрів моделі шляхом перехресної перевірки або обв'язки завантаження. Наприклад, якщо ви будуєте просту модель "найближчих сусідів" для класифікації, скільки сусідів слід використовувати? 2? 10? 100? Caret допомагає вам відповісти на …

2
Якщо інтерес представляє лише прогнозування, навіщо використовувати ласо через хребет?
На сторінці 223 у вступі до статистичного навчання автори узагальнюють відмінності між регресією хребта та ласо. Вони наводять приклад (рис. 6.9) того, коли "ласо має тенденцію перевершити регресію хребта в плані зміщення, дисперсії та MSE". Я розумію, чому ласо може бути бажаним: це призводить до рідкісних рішень, оскільки він зменшує …

8
Яка різниця між передбаченням і висновком?
Я читаю " Вступ до статистичного навчання ". У главі 2 вони обговорюють причину оцінки функції .fff 2.1.1 Чому оцінюємо ?fff Є дві основні причини , ми , можливо , забажає оцінити е : передбачення і умовиводів . Ми обговорюємо кожного по черзі. Я читав це вже кілька разів, але …

4
Що робити, коли моя нейронна мережа погано генералізується?
Я треную нейронну мережу, і втрата тренінгу зменшується, але втрата валідації не робить, або зменшується набагато менше, ніж я б очікував, виходячи з посилань або експериментів із дуже схожими архітектурами та даними. Як я можу це виправити? Щодо питання Що робити, коли моя нервова мережа не навчається? для чого це …


1
Чому тест Мантеля віддається перевазі порівняно з Моранським І?
Тест Мантеля широко застосовується в біологічних дослідженнях для вивчення кореляції між просторовим розподілом тварин (положення в просторі) з, наприклад, їх генетичною спорідненістю, швидкістю агресії або яким-небудь іншим ознакою. Використовують безліч хороших журналів ( PNAS, поведінка тварин, молекулярна екологія ... ). Я сфабрикував деякі зразки, які можуть траплятися в природі, але …

1
Що легко інтерпретувати, корисність придатних заходів для лінійних моделей зі змішаними ефектами?
Зараз я використовую пакет Rme lme4 . Я використовую лінійні моделі змішаних ефектів із випадковими ефектами: library(lme4) mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + # random effects mod3 …


2
Хто винайшов стохастичний градієнтний спуск?
Я намагаюся зрозуміти історію градиентного методу і стохастичного градієнтного спуску . Градієнтний спуск був винайдений у Коші в 1847 році. Méthode générale pour la résolution des systèmes d'équations simultanées . С. 536–538 Детальніше про це дивіться тут . Відтоді методи градієнтного спуску продовжували розвиватися, і я не знайомий з їх …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.