Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних


7
Чи визнає Байєс, що існує одне фіксоване значення параметра?
У баєсівському аналізі даних параметри трактуються як випадкові величини. Це випливає з байєсівської суб'єктивної концептуалізації ймовірності. Але чи теоретично байєси визнають, що в реальному світі є одне справжнє фіксоване значення параметра? Здається, очевидною відповіддю є «так», тому що тоді намагатися оцінити параметр було б майже безглуздим. Цитувальна академічна цитата на …

5
Зв'язок між
Скажімо, у мене є два одновимірних масиви, і . Кожен містить 100 точок даних. - фактичні дані, а - прогноз моделі. У цьому випадку значення було б: Тим часом це було б дорівнює квадратному значенню коефіцієнта кореляції, Тепер, якщо я поміняю два місця: - це фактичні дані, а - прогноз …

4
Чи слід «створювати» коваріати, які не мають статистичного значення?
У моєму розрахунку для моделі є кілька коваріатів, і не всі вони є статистично значимими. Чи слід видаляти ті, що їх немає? Це питання обговорює явище, але не відповідає на моє запитання: Як інтерпретувати несуттєвий ефект коваріату в ANCOVA? У відповіді на це запитання немає нічого, що говорить про те, …

5
Використання LASSO з пакету lars (або glmnet) в R для вибору змінної
Вибачте, якщо це питання стикається з невеликим принципом. Я хочу використовувати вибір змінної LASSO для множинної лінійної регресійної моделі в Р. У мене є 15 предикторів, один з яких є категоричним (це спричинить проблему?). Після встановлення і я використовую такі команди:ухxxуyy model = lars(x, y) coef(model) Моя проблема, коли я …

3
Чому закон великої кількості не застосовується у випадку ціни акцій Apple?
Ось стаття в Нью-Йорку, яка називається "Apple протистоїть закону великої кількості" . Він намагається пояснити зростання цін акцій Apple, використовуючи закон великої кількості. Які статистичні (або математичні) помилки робить ця стаття?

2
Моделювання аналізу потужності логістичної регресії - розроблені експерименти
Це запитання є відповіддю на відповідь @Greg Snow щодо запитання, яке я задав щодо аналізу потужності з логістичною регресією та SAS Proc GLMPOWER. Якщо я розробляю експеримент і аналізую результати факторної логістичної регресії, як я можу використовувати моделювання (і тут ) для проведення аналізу потужності? Ось простий приклад, коли є …

1
Як інтерпретувати та повідомляти ета-квадрат / частковий ета-квадрат у статистично значущих та несуттєвих аналізах?
У мене є дані, у яких значення ета-квадратів та часткові ета-квадратні значення обчислюються як міра розміру ефекту для середньогрупових різниць. Яка різниця між ета-квадратом і частковою ета-квадратом? Чи можна їх обох інтерпретувати, використовуючи ті самі керівні принципи Коена (я вважаю, що 1988: 0,01 = малий, 0,06 = середній, 0,13 = …

4
Яке значення слова "." (Крапка) в R?
Я просто читаю книгу "Р в горішці". І, здається, я пропустив ту частину, де "". як у "sample.formula" було пояснено. > sample.formula <- as.formula(y~x1+x2) Чи зразок об’єкта з формулою поля, як в інших мовах? І якщо так, то як я можу дізнатися, які ще поля / функції має цей об’єкт? …
39 r 

2
Модель логістичної регресії не збігається
У мене є деякі дані про рейси авіакомпанії (у кадрі даних, який називається flights), і я хотів би побачити, чи впливає час польоту на ймовірність значно затримки прильоту (мається на увазі 10 і більше хвилин). Я подумав, що я буду використовувати логістичну регресію з тим, що час польоту є передбачувачем, …
39 r  logistic  separation 

6
Регресія в найменшій куті проти лассо
Регресія з найменшим кутом і ласо мають тенденцію до отримання дуже схожих контурів регуляризації (однакові за винятком випадків, коли коефіцієнт перетинає нуль.) Вони обидва можуть ефективно підходити за допомогою практично однакових алгоритмів. Чи є коли-небудь практичні причини віддати перевагу одному методу перед іншим?
39 regression  lasso 

3
Режим, клас та тип об'єктів R
Мені було цікаво, чим відрізняються об'єкти Mode, Class та Type R? Тип об'єкта R може бути отриманий за допомогою функції typeof (), режиму за режимом () та класу за класом (). Також будь-які інші подібні функції та концепції, які я пропустив? Дякую та з повагою!
39 r 

8
Як перевірити гіпотезу про відсутність групових відмінностей?
Уявіть, що у вас є дослідження з двома групами (наприклад, чоловіки та жінки), які розглядають числову залежну змінну (наприклад, бали тестів інтелекту), і у вас є гіпотеза про відсутність групових відмінностей. Питання: Який хороший спосіб перевірити, чи немає групових відмінностей? Як би ви визначили розмір вибірки, необхідний для адекватного тестування …

3
Clojure порівняно з R: переваги та недоліки для аналізу даних
У мене був план вивчення R найближчим часом. Читаючи ще одне запитання, я дізнався про Clojure. Тепер я не знаю, що робити. Я думаю, що велика перевага R для мене полягає в тому, що деякі люди з економіки використовують його, в тому числі один з моїх керівників (хоча інший сказав: …
39 r 

8
Функція огляду графічних даних (резюме) в R
Я впевнений, що раніше я стикався з такою функцією в пакеті R, але після обширного гуглінгу я не можу знайти його ніде. Функція, про яку я думаю, створила графічний підсумок для заданої йому змінної, даючи вихід з деякими графіками (гістограмою, можливо, графікою коробки та вуса) та деяким текстом, що дає …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.