Запитання з тегом «terminology»

Використання та значення конкретних технічних слів / понять у статистиці.

4
Точність машини для підвищення градієнта зменшується зі збільшенням кількості ітерацій
Я експериментую з алгоритмом машини для підвищення градієнта через caretпакет в Р. Використовуючи невеликий набір даних про вступ до коледжу, я застосував такий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
"Змінна манекена" проти "змінної індикатора" для номінальних / категоричних даних
"Змінна манекен" та "змінна індикатора" - це мітки, що часто використовуються для опису належності до категорії з кодуванням 0/1; зазвичай 0: Не є членом категорії, 1: Член категорії. 26.11.2014 швидкий пошук на scilar.google.com (із додаються цитатами) виявляє, що "фіктивна змінна" використовується приблизно в 318000 статтях, а "змінна показник" використовується приблизно …

1
Тезаурус для статистики та термінів машинного навчання
Чи існує довідковий тезаурус для статистики та термінів машинного навчання? Я знаю, що статті Вікіпедії часто містять синоніми, але я хотів би мати простий тезаурус, який я міг би легко пройти (проти повної енциклопедії), щоб переконатися, що знаю всі жаргони.

1
Різниця між тестом на рандомізацію та перестановковим тестом
У літературі терміни Рандомізація та Перестановка вживаються взаємозамінно. Багато авторів заявляють про "перестановку (також рандомізацію) тестів", або навпаки. У кращому випадку я вважаю, що різниця є тонкою, і вона полягає в їх припущеннях щодо даних та потенційних висновків, які можна зробити. Мені просто потрібно перевірити, чи моє розуміння правильне, чи …

5
Різниця між термінами "спільний розподіл" та "багатоваріантний розподіл"?
Я пишу про використання "спільного розподілу ймовірностей" для аудиторії, яка з більшою ймовірністю зрозуміє "багатоваріантний розподіл", тому я розглядаю можливість використання пізніше. Однак я не хочу втрачати сенс, роблячи це. Вікіпедія, схоже, вказує, що це синоніми. Чи вони? Якщо ні, то чому б і ні?

3
Мінімальна кількість шарів у глибокій нейромережі
З цього моменту ми починаємо класифікувати багатошарові нейронні мережі як глибокі нейронні мережі або викласти його по-іншому: "Яка мінімальна кількість шарів у глибокій нейронній мережі?"

2
Що таке помилка Байєса в машинному навчанні?
http://www.deeplearningbook.org/contents/ml.html Сторінка 116 пояснює помилку Байєса, як показано нижче Ідеальна модель - це оракул, який просто знає справжній розподіл ймовірностей, який генерує дані. Навіть така модель все-таки матиме певну помилку у багатьох проблемах, оскільки все ще може бути якийсь шум у розподілі. У випадку керованого навчання відображення від x до …

1
Як називається середнє значення найбільших і найменших значень у заданому наборі даних?
Як ви називаєте статистичне середнє значення, яке обчислюється від верхньої та нижньої крайностей у будь-якому даному наборі даних? Наприклад, якщо у вас є набір: { -2, 0 , 8, 9, 1, 50, -2, 6} Верхня крайність цього набору є, 50а нижня крайність - -2. Отже, середнє значення буде крайнім(-2 + …

2
Чи робить Вольфрам Mathworld помилку, описуючи дискретний розподіл ймовірностей з функцією густини ймовірностей?
Зазвичай розподіл ймовірності на дискретні змінні описується за допомогою функції масової ймовірності (PMF): Працюючи з безперервними випадковими змінними, ми описуємо розподіли ймовірностей за допомогою функції щільності ймовірностей (PDF), а не функції масової ймовірності. - Глибоке навчання Гудффелла, Бенджо та Курвіля Однак Wolfram Mathworld використовує PDF для опису розподілу ймовірностей по …

6
Нітпікінг про активне / пасивне використання "корельованих"
Я вагаюся, чи запитувати це тут у статистиці StackExchange або в мовознавстві / англійській мові, але я вважаю, що тут може бути більше користувачів, які не сприймають мови, ніж користувачів, які користуються статистикою на іншому форумі;) Я часто читаю доповіді, в яких згадується про кореляцію як дієслово в активному голосі, …

3
Визначення сім'ї розподілу?
Чи має сім'я з розподілу інше визначення статистики, ніж в інших дисциплінах? Взагалі сімейство кривих - це сукупність кривих, кожна з яких задається функцією або параметризацією, в якій змінюється один або кілька параметрів. Такі сім'ї використовуються, наприклад, для характеристики електронних компонентів . Для статистики сім'я за одним джерелом є результатом …

3
Що означає "машина" в "машині підтримки вектора" та "машині з обмеженим набором Больцмана"?
Чому їх називають «машинами»? Чи є в цьому контексті слово "машина"? (Як і назва "лінійне програмування" може бути заплутаним, але ми знаємо, чому його називають "програмуванням".)



1
Як "Основна теорія факторного аналізу" застосовується до PCA, або як визначаються навантаження PCA?
Зараз я переживаю слайд, який я маю для "факторного аналізу" (PCA, наскільки я можу сказати). У ній виведена "фундаментальна теорема факторного аналізу", яка стверджує, що матрицю кореляції даних, що надходять в аналіз ( ), можна відновити за допомогою матриці факторних навантажень ( A ):RR\bf RAA\bf A R = A A⊤R=AA⊤\bf …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.