Статистика та великі дані terminology

1

Яка різниця між "навантаженнями" та "кореляційними навантаженнями" в PCA та PLS?

Одне загальне, що потрібно робити при аналізі головних компонентів (PCA) - це побудувати два навантаження один на одного для дослідження взаємозв'язків між змінними. У документі, що супроводжує пакет PLS R для регресії головних компонентів та регресії PLS, є інший графік, який називається графіком кореляційних навантажень (див. Рисунок 7 та сторінку …

11 r pca terminology partial-least-squares biplot

2

"Ліберальні" p-значення?

Моє запитання досить смислове. Коли метод звичайно дає високі значення р, він називається консервативним. Ви б назвали зворотне, тобто метод з високим коефіцієнтом помилок типу II, ліберальним?

11 hypothesis-testing statistical-significance p-value terminology type-i-and-ii-errors

2

Чому лема Неймана-Пірсона є лемою, а не теоремою?

Це скоріше питання історії, ніж технічне. Чому `` лема Неймана-Пірсона '' є лемою, а не теоремою? посилання на вікі: https://en.wikipedia.org/wiki/Neyman%E2%80%93Pearson_lemma NB : Питання полягає не в тому, що таке лема і як леми використовуються для доведення теореми, а в історії леми Неймана-Пірсона. Це було використано для доведення теореми, і тоді …

10 hypothesis-testing terminology history neyman-pearson-lemma

4

Чи "випадкова проекція" строго кажучи не є проекцією?

Поточні реалізації алгоритму випадкової проекції зменшують розмірність зразків даних, відображаючи їх від RdRd\mathbb R^d до RkRk\mathbb R^k використовуючи матрицю проекцій d×kd×kd\times kRRR , записи якої є відповідним розподілом (наприклад, від N(0,1)N(0,1)\mathcal N(0,1) ): x′=1k√xRx′=1kxRx^\prime = \frac{1}{\sqrt k}xR Зручно, що існують теоретичні докази, що показують, що це відображення приблизно зберігає попарні …

10 terminology dimensionality-reduction linear-algebra random-projection

6

Як називається «гаряче» кодування у науковій літературі?

Як називається оператор, який приймає категоричний вектор і перетворює його у двійкове представлення за допомогою однокольорового кодування? Мені цікаво, оскільки я пишу науковий документ і мені потрібна відповідна назва.

10 terminology categorical-encoding

4

Що саме означає "набір даних"?

Це просто агрегація точок даних? Або це представлення точок даних для різних елементів у табличному форматі, розташованому зі значеннями різних змінних? Чим він відрізняється від необроблених даних?

10 dataset terminology definition

2

Чи зміщення є властивістю оцінювача чи конкретних оцінок?

Як приклад, я часто зустрічаю студентів, які знають, що спостережуване є упередженим оцінювачем населення . Потім, пишучи свої звіти, вони говорять про такі речі:R2R2R^2R2R2R^2 "Я обчислив спостережувані та скориговані , і вони були досить схожими, що передбачає лише невелику кількість зміщення в отриманому нами значення спостережуваного ".R2R2R^2R2R2R^2R2R2R^2 Я розумію, що, …

10 mathematical-statistics terminology bias estimators

1

Назви кумулянтів і назв вищого порядку виходять за межі дисперсії, косості та куртозу

У фізиці або математичній механіці, починаючи з часової позиції , можна отримати швидкість зміни через похідні по часу: швидкість, прискорення, ривок (3-й порядок), джунс (4-й порядок).x(t)x(t)x(t) Деякі з них вже пропонували хапати, тріскати, поп для похідних до сьомого порядку. Моменти, натхненні механічною фізикою та теорією еластичності, важливі і в статистиці, …

10 distributions terminology moments notation history

3

Звідки взявся термін «вивчити модель»

Часто я чув, як шахтарі даних тут використовують цей термін. Як статистик, який працював над проблемами класифікації, я знайомий з терміном "навчити класифікатора", і я припускаю, що "вивчити модель" означає те саме. Я не проти терміна "тренуйте класифікатора". Це, здається, відображає ідею підгонки моделі, оскільки навчальні дані використовуються для отримання …

10 classification data-mining terminology model

1

Лівостороння та права бічна номенклатура в регресійних моделях

y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} Мова для опису регресійних моделей, така як дуже проста лінійна регресія, зазначена вище, часто змінюється, і такі зміни часто несуть тонкі зрушення в значеннях. Наприклад, частина моделі в лівій частині рівняння може називатися (серед інших я не знаю) конотаціями та позначеннями в дужках: …

10 regression terminology

1

Студизовані залишки v / s стандартизовані залишки в lm-моделі

Чи "студизовані залишки" та "стандартизовані залишки" однакові у регресійних моделях? Я побудував модель лінійної регресії в R і хотів побудувати графік встановлених значень Studentized залишків v / s, але не знайшов автоматизованого способу зробити це в Р. Припустимо, у мене є модель library(MASS) lm.fit <- lm(Boston$medv~(Boston$lstat)) то використання plot(lm.fit)не дає …

10 r regression residuals terminology

2

Що таке ізотропна (сферична) матриця коваріації?

Чи не міг би хтось простим чином пояснити мені, що таке ізотропна матриця коваріації? Я нічого не можу знайти в Інтернеті.

10 terminology covariance-matrix definition

3

Чи обчислення "фактичної ймовірності покриття" те саме, що обчислення "достовірного інтервалу"?

Я читав підручник зі статистикою початкового рівня. У главі про максимальну оцінку ймовірності частки успішності в даних з біноміальним розподілом було дано формулу для обчислення довірчого інтервалу, а потім нестандартно згадується Розглянемо його фактичну ймовірність покриття, тобто ймовірність того, що метод виробляє інтервал, який фіксує справжнє значення параметра. Це може …

10 confidence-interval terminology coverage-probability

1

Чи має функція стандартну назву?

Чи має у формі стандартна назва? Наприклад, - це лінійна функція.ех/ (1+ех)ех/(1+ех)e^x/(1+e^x)у= a + b xу=а+бхy = a + bx

9 logistic neural-networks deep-learning terminology

2

Декомпозиція дисперсії зміщення: термін для очікуваної помилки прогнозу в квадраті за вирахуванням помилки

Хасті та ін. "Елементи статистичного навчання" (2009) розглядають процес формування даних Y= f( X) + εY=f(X)+ε Y = f(X) + \varepsilon з E (ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0 і Var ( ε ) =σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon}. Вони представляють наступне розмежування дисперсійної дисперсії очікуваної помилки прогнозу в квадраті в точці х0x0x_0 (с. 223, формула 7.9): Помилка (х0)= …

9 variance forecasting prediction terminology bias

Запитання з тегом «terminology»