Статистика та великі дані

3

Чи може PCA працювати для булевих (бінарних) типів даних?

Я хочу зменшити розмірність систем вищого порядку і захопити більшу частину коваріації на переважно двовимірне або 1 мірне поле. Я розумію, що це можна зробити за допомогою аналізу основних компонентів, і я використовував PCA у багатьох сценаріях. Однак я ніколи не використовував його з булевими типами даних, і мені було …

38 pca data-visualization binary-data dimensionality-reduction correspondence-analysis

2

ImageNet: що таке коефіцієнт помилок топ-1 та топ-5?

У класифікаційних роботах ImageNet коефіцієнт помилок топ-1 та топ-5 є важливими одиницями для вимірювання успішності деяких рішень, але які показники помилок? У класифікації ImageNet з глибокими згортковими нейронними мережами Крижевського та ін. кожне рішення, засноване на одній єдиній CNN (стор. 7), не має кращих 5 помилок, тоді як у тих, …

38 classification neural-networks error measurement-error image-processing

2

Чи незвично для MEAN перевершувати ARIMA?

Нещодавно я застосував цілу низку методів прогнозування (MEAN, RWF, ETS, ARIMA та MLP) і виявив, що MEAN справився на диво добре. (ЗНАЧЕНО: де всі майбутні прогнози прогнозуються як рівні середнього арифметичного спостережуваних значень.) MEAN навіть перевершує ARIMA у трьох використаних нами рядах. Що я хочу знати, якщо це незвично? Чи …

38 forecasting arima

3

Як працює наближення сідлових точок?

Як працює наближення сідлових точок? Для якої проблеми це добре? (Сміливо використовуйте конкретний приклад або приклади для ілюстрації) Чи є якісь недоліки, труднощі, на що слід звернути увагу, чи пастки для необережних?

38 distributions mathematical-statistics mgf saddlepoint-approximation partial-moments

3

Настанова щодо вибору гіперпараметрів у програмі глибокого навчання

Я шукаю документ, який міг би допомогти в наданні настанови про те, як вибрати гіперпараметри глибокої архітектури, як-от складені автокодери або глибокі мережі. Гіперпараметрів дуже багато, і я дуже розгублений у тому, як їх вибрати. Також використання перехресної перевірки не є можливим, оскільки навчання дійсно займає багато часу!

38 machine-learning deep-learning deep-belief-networks hyperparameter

1

Розрахований вручну

Я знаю, що це досить специфічне Rзапитання, але я, можливо, думаю про відхилення в пропорції, пояснене, , неправильно. Ось іде.R2R2R^2 Я намагаюся використовувати Rпакет randomForest. У мене є деякі дані про навчання та дані тестування. Коли я підходить до випадкової лісової моделі, ця randomForestфункція дозволяє вводити нові дані тестування для …

38 r correlation predictive-models random-forest r-squared

3

Інтернет проти офлайн навчання?

Яка різниця між офлайн і онлайн-навчанням ? Це лише питання навчання за всім набором даних (офлайн) порівняно з навчанням поступово (по одному екземпляру)? Які приклади алгоритмів використовуються в обох?

38 machine-learning online

4

Що таке інваріантність перекладу в комп'ютерному зорі та конволюційній нейромережі?

У мене немає фону з комп’ютерним зором, але коли я читаю деякі статті та документи, пов'язані з обробкою зображень та конволюційними нейронними мережами, постійно стикаюся з терміном translation invariance, або translation invariant. Або я читаю багато, що забезпечує згортання translation invariance? !! що це означає? Я сам завжди перекладав це …

38 machine-learning conv-neural-network convolution computer-vision

3

Застосовуйте вбудовування слів до всього документа, щоб отримати вектор функції

Як я можу використовувати вбудовуване слово для зіставлення документа на функціональний вектор, придатний для використання під контролем навчання? Слово вкладення відображає кожне слово до вектору , де деякі не дуже велика кількість (наприклад, 500). Популярні вбудовані слова включають word2vec та Glove .шшwv ∈ Rгv∈Rгv \in \mathbb{R}^dггd Я хочу застосувати контрольоване …

38 classification natural-language supervised-learning word2vec word-embeddings

2

A / B тести: z-test vs t-test vs chi square vs test точний тест

Я намагаюся зрозуміти міркування, вибираючи конкретний тестовий підхід при роботі з простим тестом A / B - (тобто, два варіанти / групи з бінарним відповіддю (перетвореним чи ні). Як приклад я буду використовувати дані нижче Version Visits Conversions A 2069 188 B 1826 220 Верхня відповідь тут чудова і говорить …

38 statistical-significance chi-squared p-value fishers-exact z-statistic

3

Які відмінності між "епохою", "партією" та "міні-партією"?

Наскільки мені відомо, коли приймається Stochastic Gradient Descent як алгоритм навчання, хтось використовує 'epoch' для повного набору даних та 'batch' для даних, що використовуються в одному кроці оновлення, в той час як інший використовує відповідно 'batch' і 'minibatch', і інші використовують "епоху" та "міні-серію". Це приводить до великої плутанини під …

38 machine-learning

1

PCA та кореспондентський аналіз у їхньому відношенні до Біплота

Біплот часто використовується для відображення результатів аналізу основних компонентів (та відповідних методик). Це подвійне або накладення розсіювання показуючи компонентів навантаження і компонентів оцінки одночасно. Сьогодні мене повідомив @amoeba, що він дав відповідь, відходячи від мого коментаря, на запитання, яке запитує про те, як виробляються / масштабуються координати біплотів; і його …

38 pca multivariate-analysis svd correspondence-analysis biplot

3

Випадкове число-Set.seed (N) у R [дублікат]

На це питання вже є відповідь тут: Що саме є насінням у генераторі випадкових чисел? 3 відповіді Я усвідомлюю, що set.seed()в R використовується один для генерації псевдовипадкових чисел. Я також усвідомлюю, що використовуючи ту саму кількість, як set.seed(123)страхує, ви можете відтворити результати. Але те, чого я не отримую, - це …

38 r random-generation

2

Інтерпретація виходу R для біноміальної регресії

Я досить новий у цьому тесті з біноміальними даними, але мені потрібно було зробити це, і тепер я не знаю, як інтерпретувати результат. Y-змінна, змінна відповіді, є біноміальною, а пояснювальні фактори - безперервними. Ось що я отримав під час підведення підсумків: glm(formula = leaves.presence ~ Area, family = binomial, data …

38 r regression logistic binomial interpretation

3

Виведення варіації коефіцієнта регресії в простій лінійній регресії

У простій лінійній регресії маємо y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u , де u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . Я отримав оцінювач: β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , деx¯x¯\bar{x} іy¯y¯\bar{y} - вибіркові засобиxxxіyyy. Тепер я хочу , щоб знайти дисперсію …

38 regression mathematical-statistics variance linear-model regression-coefficients