Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

15
Чому параметрична статистика коли-небудь віддаватиме перевагу непараметричній?
Чи може хтось мені пояснити, чому хтось обрав би параметричний над непараметричним статистичним методом для тестування гіпотез чи регресійного аналізу? На мій погляд, це як поїхати на рафтинг і вибрати не водостійкий годинник, тому що ви не зможете його намочити. Чому б не використати інструмент, який працює у кожному випадку?


9
Які недоліки використання ласо для змінного вибору для регресії?
З того, що мені відомо, використання ласо для змінного вибору вирішує проблему корельованих входів. Крім того, оскільки він еквівалентний регресії з найменшим кутом, він обчислюється не повільно. Однак багато людей (наприклад, люди, яких я знаю, що займаються біостатистикою) все ще, здається, віддають перевагу поетапному або поетапному змінному вибору. Чи є …

8
Як я можу допомогти гарантувати, що дані тестування не просочуються до даних про навчання?
Припустимо, у нас є хтось, який будує модель прогнозування, але хтось не обов'язково добре розбирається в правильних статистичних або машинних принципах навчання. Можливо, ми допомагаємо цій людині, коли вона навчається, або, можливо, вона використовує якийсь програмний пакет, для використання якого потрібні мінімальні знання. Тепер ця людина може цілком зрозуміти, що …

6
Де вирізати дендрограму?
Ієрархічна кластеризація може бути представлена ​​дендрограмою. Вирізання дендрограми на певному рівні дає набір кластерів. Вирізання на іншому рівні дає ще один набір кластерів. Як би ви вибрали, де вирізати дендрограму? Чи є щось, що ми могли б вважати оптимальним моментом? Якщо я дивлюсь на дендрограму впродовж часу, коли вона змінюється, …


5
Яке відношення між кластеризацією k-засобів та PCA?
Загальна практика застосовувати PCA (аналіз основних компонентів) перед алгоритмом кластеризації (наприклад, k-засоби). Вважається, що це покращує результати кластеризації на практиці (зниження шуму). Однак мене цікавить порівняльне та поглиблене вивчення взаємозв'язку PCA та k-засобів. Наприклад, Кріс Дінг та Xiaofeng He, 2004 р., K-означає Кластеризація за допомогою аналізу основних компонентів, показали, що …

2
Чим відрізняється відбілювання ZCA від відбілювання PCA?
Мене бентежить питання відбілювання ZCA та нормального відбілювання (що отримується шляхом ділення основних компонентів на квадратні корені власних значень PCA). Наскільки мені відомо, xZCAwhite=UxPCAwhite,xZCAwhite=UxPCAwhite,\mathbf x_\mathrm{ZCAwhite} = \mathbf U \mathbf x_\mathrm{PCAwhite},деUU\mathbf U - власні вектори PCA. У чому полягає застосування відбілювання ZCA? Які відмінності між нормальним відбілюванням та відбілюванням ZCA?

3
Чому оцінка гребня стає кращою за OLS, додаючи константу до діагоналі?
Я розумію, що оцінка регресії хребта - це яка мінімізує залишкову суму квадрата та штраф у розміріββ\betaββ\beta βridge=(λID+X′X)−1X′y=argmin[RSS+λ∥β∥22]βridge=(λID+X′X)−1X′y=argmin⁡[RSS+λ‖β‖22]\beta_\mathrm{ridge} = (\lambda I_D + X'X)^{-1}X'y = \operatorname{argmin}\big[ \text{RSS} + \lambda \|\beta\|^2_2\big] Однак я не повністю розумію значення того факту, що βridgeβridge\beta_\text{ridge} відрізняється від βOLSβOLS\beta_\text{OLS} лише додаванням невеликої константи до діагоналі X′XX′XX'X . …

7
Оптимізація, коли функція витрат повільно оцінюється
Градієнтний спуск та багато інших методів корисні для пошуку місцевих мінімумів у функціях витрат. Вони можуть бути ефективними, коли функцію витрат можна швидко оцінити в кожній точці, чисельно, чи аналітично. У мене є те, що мені здається незвичайною ситуацією. Кожна оцінка моєї функції витрат дорога. Я намагаюся знайти набір параметрів, …

12
Тести з двома хвостами ... Я просто не переконаний. В чому справа?
Наступний уривок із статті: Які відмінності між однохвостими та двохвостими тестами? , на довідковому сайті UCLA зі статистикою. ... розглянути наслідки відсутності ефекту в іншому напрямку. Уявіть, що ви розробили новий препарат, який, на вашу думку, є покращенням порівняно з існуючим препаратом. Ви хочете максимально покращити свою здатність виявляти поліпшення, …

13
Якщо ми не зможемо відкинути нульову гіпотезу у великому дослідженні, чи не є це свідченням нуля?
Основним обмеженням перевірки значущості гіпотези є те, що воно не дозволяє досліднику збирати докази на користь нуля ( Джерело ) Я бачу цю заяву повторювану в декількох місцях, але не можу знайти виправдання для неї. Якщо ми проводимо велику дослідження , і ми не знаходимо статистично значущі докази проти нульової …

3
Поясніть комікс xkcd jean bean: Що робить це смішним?
Я бачу , що один раз з двадцяти повних тестів , якими вони управляють, , так що вони помилково вважають , що під час одного з двадцяти тестів, результат має велике значення ( 0,05 = +1 / 20 ).p&lt;0.05p&lt;0.05p < 0.050.05=1/200.05=1/200.05 = 1/20 Комікс xkcd jean bean - "Значне" Назва: …

6
Куди пішли частістсько-байєські дебати?
Світ статистики був поділений між відвідувачами та байєсами. У наші дні, здається, кожен робить і те і інше. Як це може бути? Якщо різні підходи підходять для різних проблем, чому батьки-засновники статистики цього не бачили? Як варіант, чи виграли дискусії частоталісти і справжні суб'єктивні байєси перейшли до теорії прийняття рішень?

4
Інтуїтивне пояснення інформації про Фішера та пов'язаного Cramer-Rao
Мені не подобається інформація про Фішера, що вона вимірює і наскільки вона корисна. Крім того, це стосунки з прив'язкою Крамера-Рао мені не видно. Чи може хтось, будь ласка, дати інтуїтивне пояснення цих понять?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.