Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

6
Різниця між мережею Байєса, нейронною мережею, деревом рішень та мережами Петрі
Яка різниця між нейронною мережею , Байєсовою мережею , деревом рішень та мережами Петрі , навіть якщо вони всі графічні моделі та візуально зображують причинно-наслідковий зв’язок.

6
Яка різниця між логістичною регресією та перцептроном?
Я збираюся через лекцію Ендрю Нг ноту на Machine Learning. Примітки вводять нас у логістичну регресію, а потім у перцептрон. Описуючи Perceptron, примітки кажуть, що ми просто змінюємо визначення порогової функції, що використовується для логістичної регресії. Після цього ми можемо використовувати модель Персептрона для класифікації. Отже, моє запитання - якщо …

5
Як окремий дослідник повинен думати про помилковий показник виявлення?
Я намагався обернути голову навколо того, як частота помилкового виявлення (FDR) повинна повідомляти висновки окремого дослідника. Наприклад, якщо ваше дослідження недостатньо, чи варто знижувати результати, навіть якщо вони значущі при ? Примітка. Я говорю про FDR в контексті вивчення результатів численних досліджень у сукупності, а не як про метод багаторазових …

3
Чому б не повідомити про середню кількість завантажувального завантаження?
Коли одна завантажує параметр для отримання стандартної помилки, ми отримуємо розподіл параметра. Чому ми не використовуємо середнє значення цього розподілу як результат або оцінку для параметра, який ми намагаємося отримати? Чи не повинен розподіл наближатись до реального? Тому ми отримали б хорошу оцінку "реальної" вартості? Але ми повідомляємо про вихідний …

3
чи слід змінити масштаб індикаторів / бінарних / фіктивних прогнокторів для LASSO
Для LASSO (та інших процедур вибору моделі) дуже важливо змінити масштаби прогнозів. Загальна рекомендація я дотримуюся просто використовувати 0, 1 середнє стандартне відхилення нормалізації для безперервних змінних. Але що тут робити з манекенами? Наприклад, кілька прикладних прикладів тієї ж (чудової) літньої школи, яку я пов’язував із перерахунком змінних безперервних змінних, …

3
Який коефіцієнт інфляції дисперсії я повинен використовувати:
Я намагаюся інтерпретувати дисперсії коефіцієнтів інфляції з використанням vifфункції в пакеті R car. Функція друкує як узагальнений і . Відповідно до файлу довідки , це останнє значенняVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Для коригування розмірності довірчого еліпсоїда функція також друкує GVIF ^ [1 / (2 * df)], де df - ступені свободи, пов'язані з терміном. …

3
Чому матриця коваріації вибірки є сингулярною, коли розмір вибірки менше числа змінних?
Скажімо, у мене ppp -вимірне багатовимірне гауссове розподіл. І я беру nnn спостереження (кожен з них ppp -векторних) від цього розподілу і обчислити зразок ковариационной матриці SSS . У цій роботі автори констатують, що матриця коваріації вибірки, обчислена з p>np>np > n є сингулярною. Як це правда чи похідне? Будь-які …

5
Як використовувати SVD для спільної фільтрації?
Я трохи заплутаний у тому, як SVD використовується при спільній фільтрації. Припустимо, у мене є соціальний графік, і я будую матрицю суміжності з країв, а потім беруть SVD (забудемо про регуляризацію, швидкість навчання, оптимізацію обмеженості тощо), як я можу використовувати цей SVD для вдосконалення своїх рекомендацій? Припустимо, мій соціальний графік …

5
Що означає глибина взаємодії в ГБМ?
У мене виникло питання про параметр глибини взаємодії в gbm в R. Це може бути питання noob, за яке я вибачаюся, але як параметр, який, на мою думку, позначає кількість кінцевих вузлів у дереві, в основному вказує X-шлях взаємодія між предикторами? Просто намагаюся зрозуміти, як це працює. Крім того, я …

1
Чи має регресія Кокса основний розподіл Пуассона?
Наша маленька команда вела дискусію і застрягла. Хтось знає, чи має регресія Кокса основний розподіл Пуассона. Ми мали дискусію про те, що, можливо, регресія Кокса з постійним ризиком у часі матиме схожість з регресією Пуассона із сильною дисперсією. Будь-які ідеї?


1
Робота аналізу основних компонентів або факторного аналізу на двійкові дані
У мене є набір даних з великою кількістю відповідей Так / Ні. Чи можна використовувати основні компоненти (PCA) або будь-який інший аналіз зменшення даних (наприклад, факторний аналіз) для цього типу даних? Підкажіть, будь ласка, як мені це робити за допомогою SPSS.

4
Яка різниця між тестом МакНемара і тестом чи-квадрата, і як ви знаєте, коли їх використовувати?
Я спробував прочитати з різних джерел, але все ще не зрозуміло, який тест був би відповідним у моєму випадку. Є три різні питання, які я задаю про свій набір даних: Суб'єктів тестують на інфекції від Х у різний час. Хочу знати, чи пропорції додатного для X після пов'язані з часткою …

5
Як отримати оцінку найменшого квадрата для множинної лінійної регресії?
У простому випадку лінійної регресії можна отримати оцінку найменшого квадрата таким чином, що вам не потрібно знати щоб оцінюватиy=β0+β1xy=β0+β1xy=\beta_0+\beta_1xβ^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2\hat\beta_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}β^0β^0\hat\beta_0β^1β^1\hat\beta_1 Припустимо , що у мене y=β1x1+β2x2y=β1x1+β2x2y=\beta_1x_1+\beta_2x_2 , як я вивести β 1 без оцінки β 2 ? чи це неможливо?β^1β^1\hat\beta_1β^2β^2\hat\beta_2

2
Що означає термін насичення нелінійностей?
Я читав статтю ImageNet Classification з глибокими згортковими нейронними мережами, і в розділі 3 вони пояснювали архітектуру своєї конволюційної нейромережі. Вони пояснюють, як вони віддали перевагу використанню: ненасичуюча нелінійністьf(x)=max(0,x).f(x)=max(0,x).f(x) = max(0, x). бо швидше було тренуватися. У цій роботі вони, схоже, називають насичуючі нелінійності як більш традиційні функції, що використовуються …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.