Запитання з тегом «robust»

Надійність взагалі стосується нечутливості статистики до відхилень від її базових припущень (Huber and Ronchetti, 2009).

14
Чому надійні (і стійкі) статистичні дані не замінили класичні методи?
При вирішенні бізнес-проблем із використанням даних прийнято вважати, що принаймні одне ключове припущення про те, що класична статистика недостатку не є дійсною. Більшість часу ніхто не намагається перевірити ці припущення, щоб ви насправді ніколи не знали. Наприклад, що так багато загальних веб-метрик є "довгохвостими" (відносно звичайного розповсюдження), на сьогоднішній день …

3
Чому ми так сильно піклуємося про нормально розподілених термінах помилок (і гомоскедастичності) в лінійній регресії, коли нам цього не потрібно?
Я припускаю, що я засмучуюся кожного разу, коли чую, як хтось каже, що ненормальність залишків та / або гетерокедастичність порушує припущення OLS. Для оцінки параметрів в моделі OLS жодне з цих припущень теоремою Гаусса-Маркова не потрібно. Я бачу, як це має значення в Тестуванні гіпотез для моделі OLS, тому що, …

4
Швидка лінійна регресія, міцна для людей, що втратили лих
Я маю справу з лінійними даними з випереджаючими людьми, деякі з яких мають більше 5 стандартних відхилень від розрахункової лінії регресії. Я шукаю техніку лінійної регресії, яка зменшує вплив цих точок. Поки що я зробив, це оцінити лінію регресії з усіма даними, потім відкинути точку даних з дуже великими залишками …

4
Повторний "надійний" варіант Stata в R
Я намагався повторити результати параметра Stata robustв Р. Я використав rlmкоманду з пакету MASS, а також команду lmrobз пакету "robustbase". В обох випадках результати сильно відрізняються від "надійного" варіанту в Stata. Чи може хтось запропонувати щось у цьому контексті? Ось результати, які я отримав, коли запустив надійний варіант у Stata: …

6
Якою була б надійна байєсівська модель для оцінки масштабу приблизно нормального розподілу?
Існує ряд надійних оцінювачів масштабу . Помітним прикладом є середнє абсолютне відхилення, яке відноситься до стандартного відхилення як . У байєсівській системі існує ряд способів чітко оцінити розташування приблизно нормального розподілу (скажімо, нормального зараження сторонніми людьми), наприклад, можна припустити, що дані поширюються як при розподілі, так і по розподілу Лапласа. …

8
Заміна випускників середнім рівнем
Це питання мені задав мій друг, який не користується Інтернетом. У мене немає статистичних даних, і я шукав Інтернет з цього питання. Питання полягає в тому, чи можна замінити середньостатистичні показники? якщо це можливо, чи є довідники / журнали для резервного копіювання цього твердження?

2
Чи достовірно оцінюються 50% довірчі інтервали, ніж довірчі інтервали 95%?
Моє запитання випливає з цього коментаря до публікації в блозі Ендрю Гелмана, в якій він виступає за використання 50% довірчих інтервалів замість 95% довірчих інтервалів, хоча не на тій підставі, що вони більш чітко оцінюються: Я віддаю перевагу інтервали від 50% до 95% з 3 причин: Обчислювальна стабільність, Більш інтуїтивна …

2
Чому ми повинні використовувати t помилки замість звичайних помилок?
У цій публікації в блозі Ендрю Гелмана є такий пасаж: Моделі Байєса 50 років тому здаються безнадійно простими (за винятком, звичайно, простих проблем), і я думаю, що байєсівські моделі сьогодні будуть здаватися безнадійно простими, 50 років тому. (Просто для простого прикладу: ми, мабуть, повинні регулярно використовувати t, а не звичайні …

2
Помилка “система обчислювально є єдиною” під час запуску glm
Я використовую пакет robustbase, щоб виконати оцінку glm . Однак коли я це роблю, я отримую таку помилку: Error in solve.default(crossprod(X, DiagB * X)/nobs, EEq) : system is computationally singular: reciprocal condition number = 1.66807e-16 Що це означає / вказує? І як я можу це налагодити? PS. Якщо вам потрібно …

4
Чому RANSAC не використовується найбільш широко в статистиці?
Виходячи з області комп’ютерного зору, я часто використовував метод RANSAC (Random Sample Consensus) для пристосування моделей до даних з великою кількістю видатків. Однак я ніколи не бачив, щоб його використовували статистики, і я завжди мав враження, що це не вважається "статистично обгрунтованим" методом. Чому це так? Він є випадковим за …

5
Наскільки надійним є тест незалежних зразків, коли розподіли зразків не є нормальними?
Я читав, що t -test є "досить надійним", коли розподіли зразків відходять від нормальності. Звичайно, важливим є розподіл вибірки різниць. У мене є дані для двох груп. Одна з груп сильно перекошена залежною змінною. Розмір вибірки досить малий для обох груп (n = 33 в одній і 45 в іншій). …

4
Як спроектувати новий вектор на простір PCA?
Після проведення аналізу основних компонентів (PCA) я хочу спроектувати новий вектор на простір PCA (тобто знайти його координати в системі координат PCA). Я розрахував PCA мовою R за допомогою prcomp. Тепер я повинен мати можливість помножити свій вектор на матрицю обертання PCA. Чи повинні головні компоненти в цій матриці розташовуватися …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
Чи має значення зважений
Я оцінив надійну лінійну модель у Rвазі MM, використовуючи rlm()пакет MASS. `R`` не дає значення моделі для моделі, але я хотів би мати його, якщо це значуща кількість. Мені також цікаво дізнатися, чи є сенс мати значення R 2, яке зважує загальну та залишкову дисперсію так само, як спостереження зважувались …

5
Які надійні методи кореляції використовуються?
Я планую зробити симуляційне дослідження, де я порівнюю ефективність декількох надійних методів кореляції з різними розподілами (косою, з атрибутами тощо). Під міцним , я маю на увазі ідеальний випадок бути стійким проти: а) перекошених розподілів, б) переживачів та в) важких хвостів. Поряд із співвідношенням Пірсона як базової лінії, я думав …

4
Середні та середні властивості
Чи може хтось пояснити мені, що я зрозумів математичну логіку, яка поєднала б два твердження (а) та (б) разом? Будемо мати набір значень (деякий розподіл). Тепер, а) медіана не залежить від кожного значення [воно просто залежить від одного або двох середніх значень]; б) Медіана - це місце мінімальних відхилень суми …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.