Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

9
Часовий ряд для даних лічильників, підрахунок <20
Нещодавно я почав працювати в клініці з туберкульозу. Періодично ми зустрічаємось, щоб обговорити кількість випадків захворювання на туберкульоз, які ми зараз лікуємо, кількість проведених тестів тощо. Я хотів би почати моделювати ці показники, щоб ми не просто здогадувались, чи є щось незвичне чи ні. На жаль, я мало навчався у …

2
Визначення часу автокореляції (для ефективного розміру вибірки)
У літературі я знайшов два визначення щодо часу автокореляції слабо нерухомого часового ряду: τa=1+2∑k=1∞ρkversusτb=1+2∑k=1∞|ρk|τa=1+2∑k=1∞ρkversusτb=1+2∑k=1∞|ρk| \tau_a = 1+2\sum_{k=1}^\infty \rho_k \quad \text{versus} \quad \tau_b = 1+2\sum_{k=1}^\infty \left|\rho_k\right| де - автокореляція в відстані . ρk=Cov[Xt,Xt+h]Var[Xt]ρk=Cov[Xt,Xt+h]Var[Xt]\rho_k = \frac{\text{Cov}[X_t,X_{t+h}]}{\text{Var}[X_t]}kkk Одним із застосувань часу автокореляції є пошук "ефективного розміру вибірки": якщо у вас є спостережень за …

1
Колмогоров-Смирнов з дискретними даними: Яке правильне використання dgof :: ks.test у R?
Питання для початківців: Я хочу перевірити, чи походять два дискретні набори даних з одного розподілу. Мені було запропоновано тест Колмогорова-Смірнова. Коновер ( Практична непараметрична статистика , 3d), схоже, говорить про те, що для цього можна використати тест Колмогорова-Смірнова, але його поведінка є «консервативною» з дискретними розподілами, і я не впевнений, …

4
Імпутація пропущених значень для PCA
Я використовував цю prcomp()функцію для виконання PCA (аналіз основних компонентів) в Р. Однак у цій функції є помилка, така що na.actionпараметр не працює. Я попросив допомоги щодо stackoverflow ; двоє користувачів там запропонували два різні способи поводження з NAцінностями. Однак проблема обох рішень полягає в тому, що коли є NAзначення, …

1
Встановлення вузлів у натуральних кубічних сплайнах у R
У мене є дані з багатьма співвіднесеними функціями, і я хочу розпочати, зменшуючи функції з плавною базовою функцією, перш ніж запускати LDA. Я намагаюся використовувати в splinesупаковці з nsфункцією природні кубічні сплайни . Як мені займатися призначенням вузлів? Ось основний код R: library(splines) lda.pred &lt;- lda(y ~ ns(x, knots=5)) Але …
23 r  splines 

7
Оцінка розподілу на основі трьох відсотків
Якими методами я можу зробити висновок про розподіл, якщо я знаю лише три процентилі? Наприклад, я знаю, що в певному наборі даних п'ятий перцентиль становить 8,135, 50-й перцентилет - 11,259, а 95-й перцентиль - 23 611. Я хочу мати можливість перейти від будь-якого іншого числа до його процентиля. Це не …

2
Покрокова лінійна обчислення алгебри з регресією найменших квадратів
Як приворот до питання про лінійно-змішані моделі в R, і поділитися як орієнтир для початківців / проміжних прихильників статистики, я вирішив опублікувати як незалежний "Q &amp; A-стиль" кроки, пов'язані з "ручним" обчисленням коефіцієнти та прогнозовані значення простої лінійної регресії. Приклад - вбудований R набір даних, mtcarsі він буде встановлений як …



2
Як реально працює завантажувальна програма в R?
Я заглядав у завантажувальний пакет у R, і, хоча знайшов чимало хороших праймерів, як ним користуватися, я ще не знайшов нічого, що б точно описувало, що відбувається "поза кадром". Наприклад, у цьому прикладі посібник показує, як використовувати стандартні коефіцієнти регресії як вихідну точку для регресії завантажувальної стрічки, але не пояснює, …

5
R 'randomForest не може обробити більше 32 рівнів. Що таке вирішення?
R-пакет randomForest R не може обробляти коефіцієнт з більш ніж 32 рівнями. Коли йому задано більше 32 рівнів, він видає повідомлення про помилку: Не може працювати з категоричними прогнозами з більш ніж 32 категоріями. Але у мене є кілька факторів. Деякі з них мають рівні 1000+, а деякі - 100+. …

2
Регресія для моделі форми ?
У мене є набір даних, який є статистикою з веб-форуму для обговорення. Я дивлюся на розподіл кількості відповідей, на які очікується тема. Зокрема, я створив набір даних, у якому є перелік кількості відповідей на теми, а потім кількість тем, що мають таку кількість відповідей. "num_replies","count" 0,627568 1,156371 2,151670 3,79094 4,59473 …

2
Машини Больцмана з обмеженою частотою проти багатошарових нейронних мереж
Я хотів експериментувати з нейронною мережею щодо проблеми класифікації, з якою я стикаюся. Я зіткнувся з паперами, які розповідають про УЗМ. Але від того, що я можу зрозуміти, вони нічим не відрізняються від наявності багатошарової нейронної мережі. Це точно? Більше того, я працюю з R і не бачу жодних консервованих …

3
Регресійне моделювання з неоднаковою дисперсією
Я хотів би помістити лінійну модель (lm), де дисперсія залишків явно залежить від пояснювальної змінної. Я знаю, як це зробити, використовуючи glm з сімейством Gamma для моделювання дисперсії, а потім вводять його обернення у вагах у функції lm (приклад: http://nitro.biosci.arizona.edu/r/chapter31 .pdf ) Мені було цікаво: Це єдиний прийом? Які ще …

4
Як написати формулу лінійної моделі зі 100 змінними в R
Заблокований . Це запитання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Чи є в R простий спосіб створити лінійну регресію над моделлю зі 100 параметрами в R? Скажімо, у нас є вектор Y з 10 значеннями та …
22 r 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.