Запитання з тегом «error»

Помилка оцінки або прогнозування - це її відхилення від справжнього значення, яке може бути непомітним (наприклад, параметри регресії) або помітним (наприклад, майбутніми реалізаціями). Використовуйте тег [message-message], щоб запитати про програмні помилки.

1
Аддитивна помилка або мультиплікативна помилка?
Я порівняно новачок у статистиці і буду вдячний допомогти зрозуміти це краще. У моєму полі є поширена модель форми: Pt=Po(Vt)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha Коли люди підходять моделі до даних, вони зазвичай лінеаризують її та відповідають наступному log(Pt)=log(Po)+αlog(Vt)+ϵlog⁡(Pt)=log⁡(Po)+αlog⁡(Vt)+ϵ\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon Чи це добре? Я десь читав, що …

5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Назва середньої абсолютної помилки, аналог балу Brier?
Вчорашнє запитання Визначте точність моделі, яка оцінює ймовірність події, мене цікавить оцінка ймовірності. Оцінка Brier - середній показник помилки у квадраті. Чи вимірює аналогічне середнє значення абсолютної похибки маєте також ім’я?1N∑i = 1N( р р е дi c t i o ni- р е фe r e n c ei)21N∑i=1N(prегicтiонi-rеfеrенcеi)2\frac{1}{N}\sum\limits …

4
Bootstrap vs Monte Carlo, оцінка помилок
Я читаю статтю Поширення помилок методом Монте-Карло в геохімічних розрахунках, Андерсон (1976), і є щось, що я не зовсім розумію. Розглянемо деякі вимірювані дані та програму, яка їх обробляє та повертає задане значення. У статті ця програма використовується для того, щоб спочатку отримати найкраще значення за допомогою даних даних (тобто: …

3
Варіаційно-коваріаційна матриця помилок у лінійній регресії
Як на практиці обчислюється матриця помилок var / cov статистичними пакетами аналізу? Ця ідея мені зрозуміла в теорії. Але не на практиці. Я маю на увазі, якщо у мене є вектор випадкових змінних , я розумію, що матриця дисперсії / коваріації буде надано зовнішній добуток векторів відхилення від середнього значення: …

3
Кількість значущих цифр, які потрібно повідомити
Чи існує більш науковий спосіб визначення кількості значущих цифр, які потрібно повідомити за середній або довірчий інтервал у ситуації, яка є досить стандартною - наприклад, перший рік в коледжі. Я бачив Кількість значущих цифр , щоб помістити в таблицю , Чому ми не використовуємо значущі цифри і числа значущих цифр …

2
Чи частота помилок є опуклою функцією лямбда параметра регуляризації?
Вибираючи параметр регуляризації лямбда в Ridge або Lasso, рекомендований метод полягає в тому, щоб спробувати різні значення лямбда, виміряти похибку у валідаційному наборі і, нарешті, обрати це значення лямбда, яке повертає найменшу помилку. Мені не чітко, якщо функція f (лямбда) = помилка - опукла. Може так бути? Тобто, чи може …

3
Надійність приталеної кривої?
Я хотів би оцінити невизначеність або надійність встановленої кривої. Я навмисно не називаю точну математичну величину, яку шукаю, оскільки не знаю, що це. Тут (енергія) - залежна змінна (відповідь), а V (об'єм) - незалежна змінна. Я хотів би знайти криву енергії-об’єму ( E ( V )) деякого матеріалу. Тому я …

1
R нейроннет - обчислення дають постійну відповідь
Я намагаюся використовувати neuralnetпакет R (документація тут ) для прогнозування. Ось що я намагаюся зробити: library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~', paste(n[!n %in% 'y'], collapse = ' + '))) …

3
Як я можу знайти стандартне відхилення стандартного відхилення вибірки від нормального розподілу?
Пробачте, якщо я пропустив щось досить очевидне. Я фізик, який по суті є (гістограмою) розподілом, орієнтованим на середнє значення, яке наближається до нормального розподілу. Важливе значення для мене - це стандартне відхилення цієї Гауссової випадкової величини. Як би я намагався знайти помилку на стандартному відхиленні вибірки? У мене є відчуття, …

4
Як концептуалізувати помилку в регресійній моделі?
Я відвідую клас аналізу даних, і деякі мої добре вкорінені ідеї хитаються. А саме думка про те, що помилка (epsilon), як і будь-яка інша різновид дисперсії, стосується лише (так я думав) для групи (вибірки або цілої сукупності). Тепер нас вчать, що одне з припущень регресії - це те, що дисперсія …

1
Помилка повідомляти з середнім та графічним зображеннями?
Я використовував широкий спектр тестів для моїх дипломних даних, від параметричних ANOVA та t-тестів до непараметричних тестів Крускала-Уолліса та Манна-Уїтні, а також двосторонніх перетворених ANOVA та GzLM з бінарними, дані про пуассоні та пропорції. Тепер мені потрібно повідомити про все, коли я все це пишу в своїх результатах. Я вже …

4
Чому методи регресії з найменшими квадратами та максимальною ймовірністю не є еквівалентними, коли помилки зазвичай не поширюються?
Назва говорить все це. Я розумію, що найменші квадрати та максимальна ймовірність дадуть однаковий результат для коефіцієнтів регресії, якщо помилки моделі нормально розподіляються. Але що станеться, якщо помилки нормально не поширюються? Чому ці два методи вже не рівнозначні?

2
Різниця між усередненням даних, що підходять, та розміщенням даних, а потім усередненням
Якщо є, між пристосуванням рядка до декількох окремих "експериментів", то усередненням пристосувань або усередненням даних із окремих експериментів, то підходом усереднених даних. Дозвольте мені детальніше: Я виконую комп'ютерне моделювання, яке генерує криву, показану нижче. Ми витягуємо величину, давайте назвемо її "А", встановивши лінійну область ділянки (тривалий час). Значення - це …
10 error  fitting  average 

1
Чи помилки в обробці даних вже «оцінені» в статистичному аналізі?
Гаразд, чесне попередження - це філософське питання, яке не стосується цифр. Я багато думав про те, як помилки повстають у набори даних у часі і як це слід ставитись до аналітиків - чи це насправді має значення взагалі? З іншого боку, я аналізую багаторічне дослідження, яке передбачає безліч наборів даних, …
10 dataset  error 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.