Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

1
Підписка підписки в очікуванні
Яке точне значення підписного позначення в умовних очікуваннях в рамках теорії вимірювань? Ці підписки не відображаються у визначенні умовного очікування, але ми можемо бачити, наприклад, на цій сторінці вікіпедії . (Зауважте, що це було не завжди так, та сама сторінка кілька місяців тому).EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] Яким має бути, наприклад, значення з X …

3
Коли використовувати узагальнені оціночні рівняння та моделі змішаних ефектів?
Я деякий час із задоволенням використовую моделі зі змішаними ефектами з поздовжніми даними. Я б хотів, щоб я міг підходити до відносин AR в lmer (я думаю, я маю рацію, що не можу цього зробити?), Але я не думаю, що це відчайдушно важливо, тому я не переживаю занадто сильно. Я …
63 mixed-model  gee 

9
Перелік ситуацій, коли байєсівський підхід простіший, практичніший або зручніший
Було багато дебатів у рамках статистики між байєсами та відвідувачами. Я, як правило, вважаю це досить відвертим (хоча я думаю, що він затих). З іншого боку, я зустрів кількох людей, які цілком прагматично поглядають на це питання, кажучи, що іноді зручніше проводити аналіз частотизму, а іноді простіше провести байєсівський аналіз. …

10
Талеб і Чорний лебідь
Книга Талеба «Чорний лебідь» була бестселером New York Times, коли вона вийшла кілька років тому. Книга зараз у другому виданні. Після зустрічі зі статистиками на JSM (щорічній статистичній конференції) Талеб дещо зменшив критику статистики. Але суть книги полягає в тому, що статистика не дуже корисна, оскільки вона покладається на нормальний …

3
Посилання, що містять аргументи проти тестування значущості гіпотез?
В останні кілька років я прочитав низку робіт, що заперечували проти використання тестування значимості нульової гіпотези в науці, але не думав вести постійний список. Нещодавно колега попросив мене щодо такого списку, тому я подумав, що я попрошу всіх тут допомогти створити його. Щоб почати все, ось що у мене поки …

8
Чи PCA супроводжується обертанням (наприклад, varimax), як і раніше PCA?
Я намагався відтворити деякі дослідження (за допомогою PCA) від SPSS в Р. На моєму досвіді, principal() функція з пакету psychбула єдиною функцією, яка наблизилася (або якщо моя пам'ять слугує мені правильно, мертвим), щоб відповідати результату. Щоб відповідати тим самим результатам, що і в SPSS, мені довелося використовувати параметр principal(..., rotate …


3
Яка різниця між нейронною мережею та мережею глибокої віри?
У мене складається враження, що коли люди посилаються на мережу "глибокої віри", що це в основному нейронна мережа, але дуже велика. Це правильно чи чи мережа глибоких переконань також означає, що алгоритм сам по собі відрізняється (тобто немає нейронної мережі вперед, але, можливо, щось із петлями зворотного зв'язку)?

6
Чому алгоритм кластеризації k-означає використовує тільки евклідову метрику відстані?
Чи є конкретна мета з точки зору ефективності чи функціональності, чому алгоритм k-засобів не використовує, наприклад, подібність косинуса (dis) як метрику відстані, а може використовувати лише евклідову норму? Загалом, чи відповідає метод К-засобів та чи буде правильним, якщо розглядаються чи використовуються інші відстані, ніж Евклідова? [Доповнення від @ttnphns. Питання двозначне. …

4
Припущення щодо оцінки невизначеності завантажувальної програми
Я ціную корисність завантажувальної програми для отримання оцінок невизначеності, але одне, що мене завжди турбує, - це те, що розподіл, відповідний цим оцінкам, - це розподіл, визначений вибіркою. Загалом, здається, поганою ідеєю вважати, що наші вибіркові частоти виглядають точно як базові розподіли, тому чому обгрунтовано / прийнятно отримувати оцінки невизначеності …

3
Як насправді побудувати зразкове дерево з randomForest :: getTree ()? [зачинено]
Кожен отримав бібліотечні чи кодові пропозиції щодо того, як насправді побудувати пару зразкових дерев : getTree(rfobj, k, labelVar=TRUE) (Так, я знаю, що ви не повинні цього робити оперативно, РФ - це чорна скринька тощо) як добре працюють кодовані фактори тощо) Попередні запитання без гідної відповіді: Як зробити випадкові ліси більш …

8
Байєси: раби ймовірності функціонують?
У своїй книзі "Вся статистика" професор Ларрі Вассерман подає наступний приклад (11.10, стор. 188). Припустимо , що ми маємо щільність такої , що , де є відомим (невід'ємне интегрируемой) функції і нормалізація постійної є невідомою .f ( x ) = cffff(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)c > 0gggc>0c>0c>0 Нас цікавлять ті випадки, коли ми не …

8
Якщо A і B співвідносяться з C, чому A і B не обов'язково співвідносяться?
Я емпірично знаю, що це так. Я щойно розробив моделі, які натрапляють на цю загадку. Я також підозрюю, що це не обов'язково відповідь так / ні. Я маю на увазі те, що якщо A і B співвідносяться з C, це може мати певний вплив на співвідношення між A і B. …

3
Що означають залишки в логістичній регресії?
Відповідаючи на це питання, Джон Крісті запропонував, що відповідність логістичних регресійних моделей слід оцінювати шляхом оцінки залишків. Мені знайоме, як інтерпретувати залишки в OLS, вони знаходяться в тій же шкалі, що і DV, і дуже чітко різниця між y та y, передбаченими моделлю. Однак для логістичної регресії я раніше просто …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.