Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

4
Яка різниця між R функціями prcomp і princomp?
Я порівняв ?prcompі ?princompзнайшов щось про аналіз основних компонентів Q-mode та R-mode (PCA). Але якщо чесно - я цього не розумію. Чи може хтось пояснити різницю, а може навіть пояснити, коли застосовувати яку?
69 r  pca 




4
Як налаштувати гіперпараметри дерев xgboost?
У мене є дані про незбалансований клас, і я хочу налаштувати гіперпараметри підсиленого тресу за допомогою xgboost. Запитання Чи є еквівалент gridsearchcv або randomsearchcv для xgboost? Якщо ні, то який рекомендований підхід до налаштування параметрів xgboost?

7
Чи потрібні всі терміни взаємодії в індивідуальній регресійній моделі?
Я фактично переглядаю рукопис, де автори порівнюють 5-6 моделей регресії логіту з AIC. Однак деякі моделі мають умови взаємодії, не включаючи окремі коваріатні терміни. Чи має сенс це робити? Наприклад (не характерно для моделей logit): M1: Y = X1 + X2 + X1*X2 M2: Y = X1 + X2 M3: …

6
Які хороші початкові ваги в нейромережі?
Я щойно чув, що хороша ідея вибирати початкові ваги нейронної мережі з діапазону , деd- кількість входів у даний нейрон. Передбачається, що множини нормалізуються - означають 0, дисперсію 1 (не знаю, чи це має значення).( - 1г√, 1г√)(−1d,1d)(\frac{-1}{\sqrt d} , \frac{1}{\sqrt d})гdd Чому це гарна ідея?

10
Що не так з екстраполяцією?
Я пам’ятаю, як сидіти на курсах статистики як недооцінене слухання того, чому екстраполяція була поганою ідеєю. Крім того, в Інтернеті є безліч джерел, які коментують це. Там також згадка про нього тут . Хтось може допомогти мені зрозуміти, чому екстраполяція - це погана ідея? Якщо це так, то як це, …

4
Як "підбити" стандартне відхилення?
У мене є середньомісячне значення та стандартне відхилення, що відповідає цьому середньому. Зараз я обчислюю річну середню як суму середньомісячних середніх, як я можу представити стандартне відхилення для підсумованого середнього? Наприклад, враховуючи вихід з вітроелектростанції: Month MWh StdDev January 927 333 February 1234 250 March 1032 301 April 876 204 …

2
Багатовимірна множинна регресія в R
У мене є 2 залежні змінні (DV), на кожну з яких може впливати набір 7 незалежних змінних (IV). ДВ є безперервними, тоді як набір ІV складається з суміші безперервних і двійкових кодованих змінних. (У коді нижче безперервні змінні записуються великими літерами, а двійкові змінні - малими літерами.) Метою дослідження є …

7
Як генерувати рівномірно розподілені точки на поверхні 3-д одиничної сфери?
Мене цікавить, як генерувати рівномірно розподілені точки на поверхні 3-д одиничної сфери? Крім того, після створення цих точок, що є найкращим способом візуалізації та перевірки, чи справді вони рівномірні на поверхні x2+y2+z2=1x2+y2+z2=1x^2+y^2+z^2=1 ?

11
Чому я повинен бути байесівцем, коли моя модель помиляється?
Правки: Я додав простий приклад: висновок про середнє значення . Я також трохи уточнив, чому вірні інтервали, що не відповідають довірчим інтервалам, є поганими.XiXiX_i Я, досить побожний байесів, перебуваю в середині кризи віри. Моя проблема полягає в наступному. Припустимо, що я хочу проаналізувати деякі дані IID . Що я б …

1
Як проста модель логістичної регресії досягає 92% точності класифікації на MNIST?
Незважаючи на те, що всі зображення в наборі даних MNIST розташовані в центрі, з подібним масштабом і зверненими вгору без обертань, вони мають значну варіацію рукописного тексту, яка здивує мене тим, як лінійна модель досягає такої високої точності класифікації. Наскільки я міг уявити, зважаючи на значну варіацію рукописного тексту, цифри …

1
40 000 неврознавчих робіт можуть бути помилковими
Я бачив цю статтю в «Економісті» про, здавалося б, руйнівній роботі [1], яка ставить під сумнів «щось на зразок 40 000 опублікованих [fMRI] досліджень». Помилка, кажуть, через "помилкові статистичні припущення". Я читаю статтю і бачу, що це частково проблема з численними виправленнями порівняння, але я не є експертом з ІМР, …

3
Чи це рішення проблеми р-значення?
У лютому 2016 року Американська статистична асоціація оприлюднила офіційну заяву про статистичну значимість та p-значення. Наша нитка про це широко обговорює ці питання. Однак жоден орган влади не запропонував запропонувати загальновизнану ефективну альтернативу - до цих пір. Американське статистичне товариство (ASS) опублікувало свою відповідь, p-значення: Що далі? "Значення р не …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.