Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

6
Якщо достовірний інтервал має рівний попередній рівень, чи дорівнює 95% довірчий інтервал, рівний 95% достовірному інтервалу?
Я дуже новачок у баєсівській статистиці, і це може бути дурним питанням. Тим не менш: Розглянемо достовірний інтервал з попереднім, який визначає рівномірний розподіл. Наприклад, від 0 до 1, де 0 до 1 являє собою весь спектр можливих значень ефекту. Чи в цьому випадку 95% достовірний інтервал буде дорівнює довірчому …

7
Чому точність перевірки коливається?
У мене є чотиришаровий CNN для прогнозування відповіді на рак за допомогою даних МРТ. Я використовую активацію ReLU для введення нелінійностей. Точність та втрати поїздів монотонно збільшуються та зменшуються відповідно. Але моя точність тесту починає дико коливатися. Я спробував змінити рівень навчання, зменшити кількість шарів. Але це не зупиняє коливання. …

2
Чи потрібен нам градієнтний спуск, щоб знайти коефіцієнти лінійної регресійної моделі?
Я намагався засвоїти машинне навчання за допомогою матеріалу Coursera . У цій лекції Ендрю Нг використовує алгоритм спуску градієнта, щоб знайти коефіцієнти лінійної регресійної моделі, які мінімізують функцію помилок (функція витрат). Для лінійної регресії нам потрібен градієнтний спуск? Здається, я можу аналітично диференціювати функцію помилок і встановити її в нуль …

3
Як Naive Bayes є лінійним класифікатором?
Я бачив інший потік тут , але я не думаю , що відповідь задовольнила актуальне питання. Що я постійно читав, це те, що Naive Bayes є лінійним класифікатором (наприклад, тут ) (таким, що він малює лінійну межу рішення), використовуючи демонстрацію шансів журналу. Однак я імітував дві хмари Гаусса і встановив …

4
Чи правда, що процентний завантажувальний пристрій ніколи не повинен використовуватися?
У примітках MIT OpenCourseWare за 18.05. Вступ до ймовірностей та статистики, Весна 2014 року (зараз доступний тут ), вказується: Метод первинного завантаження привабливий завдяки своїй простоті. Однак це залежить від розподілу завантажувального завантаження на основі конкретного зразка, який є хорошим наближенням до справжнього розподілу . Райс говорить про метод процентиля, …

4
Логістична регресія - термін помилок та її розповсюдження
Про те, чи існує термін помилки в логістичній регресії (та її припущеному розподілі), я читав у різних місцях, що: термін помилки не існує термін помилки має біноміальний розподіл (відповідно до розподілу змінної відповіді) термін помилки має логістичний розподіл Може хтось, будь ласка, уточнить?

2
Відносна важливість набору предикторів у випадковій класифікації лісів у R
Я хотів би визначити відносну важливість наборів змінних до randomForestкласифікаційної моделі в Р. importanceФункція забезпечує MeanDecreaseGiniметрику для кожного окремого предиктора - чи це так просто, як підсумовувати це для кожного предиктора в наборі? Наприклад: # Assumes df has variables a1, a2, b1, b2, and outcome rf <- randomForest(outcome ~ ., …

2
формат даних libsvm [закрито]
Я використовую інструмент libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) для класифікації вектора підтримки. Однак я збентежений щодо формату вхідних даних. З ПРОЧИТАННЯ: Формат файлу даних про навчання та тестування: <label> <index1>:<value1> <index2>:<value2> ... . . . Кожен рядок містить екземпляр і закінчується символом '\ n'. Для класифікації <label>- це ціле число, що …

4
Коли справедлива оцінка завантаження для зміщення?
Часто стверджується, що завантажувальне завантаження може забезпечити оцінку зміщення в оцінці. Якщо - оцінка для деякої статистики, і - це репліки завантажувальної програми (з ), то оцінка завантаження завантажувальної зсуву \ \ {{рівняння} \ mathrm {упередженість} _t \ приблизно \ frac {1} {N} \ sum_i \ tilde {t} _i- \ …
31 bootstrap  bias 

3
Середня помилка у квадраті та залишкова сума квадратів
Переглядаючи визначення Вікіпедії: Середня помилка в квадраті (MSE) Залишкова сума квадратів (RSS) Мені це здається MSE=1NRSS=1N∑(fi−yi)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 де NNN - кількість зразків, а - наша оцінка .fifif_iyiyiy_i Однак жодна із статей Вікіпедії не згадує про ці стосунки. Чому? Я щось пропускаю?
31 residuals  mse 

3
За яким розподілом слід мої дані?
Скажімо, що у мене є 1000 компонентів, і я збирав дані про те, скільки разів цей помилок записується, і кожен раз, коли вони реєстрували помилку, я також відслідковую, скільки часу моїй команді потрібно було вирішити проблему. Коротше кажучи, я записував час на ремонт (у секундах) для кожного з цих 1000 …

3
Чи можна розрахувати AIC та BIC для регресійних моделей ласо?
Чи можна обчислити значення AIC або BIC для регресійних моделей ласо та інших регульованих моделей, де параметри лише частково вводяться в рівняння. Як можна визначити ступеня свободи? Я використовую R для підключення регресійних моделей ласо з glmnet()функцією з glmnetпакету, і я хотів би знати, як обчислити значення AIC та BIC …
31 r  model-selection  lasso  aic  bic 

2
Сирі залишки порівняно з стандартизованими залишками проти залишків, що вивчаються студентами - що використовувати коли?
Це схоже на подібне запитання і не отримало багато відповідей. Пропускаючи тести, такі як Кук Д, і просто дивлячись на залишки як на групу, мене цікавить, як інші використовують залишки під час оцінки придатності. Я використовую залишки сировини: у QQ-графіку для оцінки нормальності у розсіюванні відносно залишків, для перевірки очним …


4
Чому ми використовуємо ReLU в нейронних мережах і як ми їх використовуємо?
Чому ми використовуємо випрямлені лінійні одиниці (ReLU) з нейронними мережами? Як це покращує нейронну мережу? Чому ми говоримо, що ReLU - це функція активації? Чи не функція активації softmax для нейронних мереж? Я здогадуюсь, що ми використовуємо обидва, ReLU та softmax, як це: нейрон 1 з виведенням softmax ----> ReLU …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.