Запитання з тегом «terminology»

Використання та значення конкретних технічних слів / понять у статистиці.

1
Яка різниця між "навантаженнями" та "кореляційними навантаженнями" в PCA та PLS?
Одне загальне, що потрібно робити при аналізі головних компонентів (PCA) - це побудувати два навантаження один на одного для дослідження взаємозв'язків між змінними. У документі, що супроводжує пакет PLS R для регресії головних компонентів та регресії PLS, є інший графік, який називається графіком кореляційних навантажень (див. Рисунок 7 та сторінку …


2
Чому лема Неймана-Пірсона є лемою, а не теоремою?
Це скоріше питання історії, ніж технічне. Чому `` лема Неймана-Пірсона '' є лемою, а не теоремою? посилання на вікі: https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma NB : Питання полягає не в тому, що таке лема і як леми використовуються для доведення теореми, а в історії леми Неймана-Пірсона. Це було використано для доведення теореми, і тоді …

4
Чи "випадкова проекція" строго кажучи не є проекцією?
Поточні реалізації алгоритму випадкової проекції зменшують розмірність зразків даних, відображаючи їх від RdRd\mathbb R^d до RkRk\mathbb R^k використовуючи матрицю проекцій d×kd×kd\times kRRR , записи якої є відповідним розподілом (наприклад, від N(0,1)N(0,1)\mathcal N(0,1) ): x′=1k√xRx′=1kxRx^\prime = \frac{1}{\sqrt k}xR Зручно, що існують теоретичні докази, що показують, що це відображення приблизно зберігає попарні …

6
Як називається «гаряче» кодування у науковій літературі?
Як називається оператор, який приймає категоричний вектор і перетворює його у двійкове представлення за допомогою однокольорового кодування? Мені цікаво, оскільки я пишу науковий документ і мені потрібна відповідна назва.

4
Що саме означає "набір даних"?
Це просто агрегація точок даних? Або це представлення точок даних для різних елементів у табличному форматі, розташованому зі значеннями різних змінних? Чим він відрізняється від необроблених даних?

2
Чи зміщення є властивістю оцінювача чи конкретних оцінок?
Як приклад, я часто зустрічаю студентів, які знають, що спостережуване є упередженим оцінювачем населення . Потім, пишучи свої звіти, вони говорять про такі речі:R2R2R^2R2R2R^2 "Я обчислив спостережувані та скориговані , і вони були досить схожими, що передбачає лише невелику кількість зміщення в отриманому нами значення спостережуваного ".R2R2R^2R2R2R^2R2R2R^2 Я розумію, що, …

1
Назви кумулянтів і назв вищого порядку виходять за межі дисперсії, косості та куртозу
У фізиці або математичній механіці, починаючи з часової позиції , можна отримати швидкість зміни через похідні по часу: швидкість, прискорення, ривок (3-й порядок), джунс (4-й порядок).x(t)x(t)x(t) Деякі з них вже пропонували хапати, тріскати, поп для похідних до сьомого порядку. Моменти, натхненні механічною фізикою та теорією еластичності, важливі і в статистиці, …

3
Звідки взявся термін «вивчити модель»
Часто я чув, як шахтарі даних тут використовують цей термін. Як статистик, який працював над проблемами класифікації, я знайомий з терміном "навчити класифікатора", і я припускаю, що "вивчити модель" означає те саме. Я не проти терміна "тренуйте класифікатора". Це, здається, відображає ідею підгонки моделі, оскільки навчальні дані використовуються для отримання …

1
Лівостороння та права бічна номенклатура в регресійних моделях
y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} Мова для опису регресійних моделей, така як дуже проста лінійна регресія, зазначена вище, часто змінюється, і такі зміни часто несуть тонкі зрушення в значеннях. Наприклад, частина моделі в лівій частині рівняння може називатися (серед інших я не знаю) конотаціями та позначеннями в дужках: …

1
Студизовані залишки v / s стандартизовані залишки в lm-моделі
Чи "студизовані залишки" та "стандартизовані залишки" однакові у регресійних моделях? Я побудував модель лінійної регресії в R і хотів побудувати графік встановлених значень Studentized залишків v / s, але не знайшов автоматизованого способу зробити це в Р. Припустимо, у мене є модель library(MASS) lm.fit <- lm(Boston$medv~(Boston$lstat)) то використання plot(lm.fit)не дає …


3
Чи обчислення "фактичної ймовірності покриття" те саме, що обчислення "достовірного інтервалу"?
Я читав підручник зі статистикою початкового рівня. У главі про максимальну оцінку ймовірності частки успішності в даних з біноміальним розподілом було дано формулу для обчислення довірчого інтервалу, а потім нестандартно згадується Розглянемо його фактичну ймовірність покриття, тобто ймовірність того, що метод виробляє інтервал, який фіксує справжнє значення параметра. Це може …


2
Декомпозиція дисперсії зміщення: термін для очікуваної помилки прогнозу в квадраті за вирахуванням помилки
Хасті та ін. "Елементи статистичного навчання" (2009) розглядають процес формування даних Y= f( X) + εY=f(X)+ε Y = f(X) + \varepsilon з E (ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0 і Var ( ε ) =σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon}. Вони представляють наступне розмежування дисперсійної дисперсії очікуваної помилки прогнозу в квадраті в точці х0x0x_0 (с. 223, формула 7.9): Помилка (х0)= …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.