Статистика та великі дані terminology

4

Точність машини для підвищення градієнта зменшується зі збільшенням кількості ітерацій

Я експериментую з алгоритмом машини для підвищення градієнта через caretпакет в Р. Використовуючи невеликий набір даних про вступ до коледжу, я застосував такий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

2

"Змінна манекена" проти "змінної індикатора" для номінальних / категоричних даних

"Змінна манекен" та "змінна індикатора" - це мітки, що часто використовуються для опису належності до категорії з кодуванням 0/1; зазвичай 0: Не є членом категорії, 1: Член категорії. 26.11.2014 швидкий пошук на scilar.google.com (із додаються цитатами) виявляє, що "фіктивна змінна" використовується приблизно в 318000 статтях, а "змінна показник" використовується приблизно …

15 categorical-data terminology categorical-encoding

1

Тезаурус для статистики та термінів машинного навчання

Чи існує довідковий тезаурус для статистики та термінів машинного навчання? Я знаю, що статті Вікіпедії часто містять синоніми, але я хотів би мати простий тезаурус, який я міг би легко пройти (проти повної енциклопедії), щоб переконатися, що знаю всі жаргони.

15 machine-learning terminology

1

Різниця між тестом на рандомізацію та перестановковим тестом

У літературі терміни Рандомізація та Перестановка вживаються взаємозамінно. Багато авторів заявляють про "перестановку (також рандомізацію) тестів", або навпаки. У кращому випадку я вважаю, що різниця є тонкою, і вона полягає в їх припущеннях щодо даних та потенційних висновків, які можна зробити. Мені просто потрібно перевірити, чи моє розуміння правильне, чи …

15 hypothesis-testing sampling terminology permutation-test

5

Різниця між термінами "спільний розподіл" та "багатоваріантний розподіл"?

Я пишу про використання "спільного розподілу ймовірностей" для аудиторії, яка з більшою ймовірністю зрозуміє "багатоваріантний розподіл", тому я розглядаю можливість використання пізніше. Однак я не хочу втрачати сенс, роблячи це. Вікіпедія, схоже, вказує, що це синоніми. Чи вони? Якщо ні, то чому б і ні?

15 probability terminology joint-distribution definition

3

Мінімальна кількість шарів у глибокій нейромережі

З цього моменту ми починаємо класифікувати багатошарові нейронні мережі як глибокі нейронні мережі або викласти його по-іншому: "Яка мінімальна кількість шарів у глибокій нейронній мережі?"

15 machine-learning neural-networks deep-learning terminology

2

Що таке помилка Байєса в машинному навчанні?

http://www.deeplearningbook.org/contents/ml.html Сторінка 116 пояснює помилку Байєса, як показано нижче Ідеальна модель - це оракул, який просто знає справжній розподіл ймовірностей, який генерує дані. Навіть така модель все-таки матиме певну помилку у багатьох проблемах, оскільки все ще може бути якийсь шум у розподілі. У випадку керованого навчання відображення від x до …

15 machine-learning deep-learning terminology

1

Як називається середнє значення найбільших і найменших значень у заданому наборі даних?

Як ви називаєте статистичне середнє значення, яке обчислюється від верхньої та нижньої крайностей у будь-якому даному наборі даних? Наприклад, якщо у вас є набір: { -2, 0 , 8, 9, 1, 50, -2, 6} Верхня крайність цього набору є, 50а нижня крайність - -2. Отже, середнє значення буде крайнім(-2 + …

14 mean terminology average range

2

Чи робить Вольфрам Mathworld помилку, описуючи дискретний розподіл ймовірностей з функцією густини ймовірностей?

Зазвичай розподіл ймовірності на дискретні змінні описується за допомогою функції масової ймовірності (PMF): Працюючи з безперервними випадковими змінними, ми описуємо розподіли ймовірностей за допомогою функції щільності ймовірностей (PDF), а не функції масової ймовірності. - Глибоке навчання Гудффелла, Бенджо та Курвіля Однак Wolfram Mathworld використовує PDF для опису розподілу ймовірностей по …

14 probability mathematical-statistics terminology pdf

6

Нітпікінг про активне / пасивне використання "корельованих"

Я вагаюся, чи запитувати це тут у статистиці StackExchange або в мовознавстві / англійській мові, але я вважаю, що тут може бути більше користувачів, які не сприймають мови, ніж користувачів, які користуються статистикою на іншому форумі;) Я часто читаю доповіді, в яких згадується про кореляцію як дієслово в активному голосі, …

14 correlation terminology

3

Визначення сім'ї розподілу?

Чи має сім'я з розподілу інше визначення статистики, ніж в інших дисциплінах? Взагалі сімейство кривих - це сукупність кривих, кожна з яких задається функцією або параметризацією, в якій змінюється один або кілька параметрів. Такі сім'ї використовуються, наприклад, для характеристики електронних компонентів . Для статистики сім'я за одним джерелом є результатом …

14 distributions terminology parametric exponential-family

3

Що означає "машина" в "машині підтримки вектора" та "машині з обмеженим набором Больцмана"?

Чому їх називають «машинами»? Чи є в цьому контексті слово "машина"? (Як і назва "лінійне програмування" може бути заплутаним, але ми знаємо, чому його називають "програмуванням".)

14 svm terminology rbm etymology

4

"-Iles" термінологія для верхнього піввідсотка

Найкращі 25% - це верхній квартир. 10% - верхній децил. Верхній 1% - верхній перцентил. Чи є еквівалент для верхніх 0,5%, тобто 1 на 200?

14 terminology quantiles

2

Що означає регресувати змінну проти іншої

Коли ми кажемо, щоб регресувати проти , чи маємо на увазі, що X є незалежною змінною, а Y - залежною змінною? тобто Y = a X + b .YYYXXXXXXY=aX+bY=aX+bY =aX + b

14 regression terminology

1

Як "Основна теорія факторного аналізу" застосовується до PCA, або як визначаються навантаження PCA?

Зараз я переживаю слайд, який я маю для "факторного аналізу" (PCA, наскільки я можу сказати). У ній виведена "фундаментальна теорема факторного аналізу", яка стверджує, що матрицю кореляції даних, що надходять в аналіз ( ), можна відновити за допомогою матриці факторних навантажень ( A ):RR\bf RAA\bf A R = A A⊤R=AA⊤\bf …

14 pca factor-analysis terminology definition

Запитання з тегом «terminology»