Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

3
Чи може PCA працювати для булевих (бінарних) типів даних?
Я хочу зменшити розмірність систем вищого порядку і захопити більшу частину коваріації на переважно двовимірне або 1 мірне поле. Я розумію, що це можна зробити за допомогою аналізу основних компонентів, і я використовував PCA у багатьох сценаріях. Однак я ніколи не використовував його з булевими типами даних, і мені було …

2
ImageNet: що таке коефіцієнт помилок топ-1 та топ-5?
У класифікаційних роботах ImageNet коефіцієнт помилок топ-1 та топ-5 є важливими одиницями для вимірювання успішності деяких рішень, але які показники помилок? У класифікації ImageNet з глибокими згортковими нейронними мережами Крижевського та ін. кожне рішення, засноване на одній єдиній CNN (стор. 7), не має кращих 5 помилок, тоді як у тих, …

2
Чи незвично для MEAN перевершувати ARIMA?
Нещодавно я застосував цілу низку методів прогнозування (MEAN, RWF, ETS, ARIMA та MLP) і виявив, що MEAN справився на диво добре. (ЗНАЧЕНО: де всі майбутні прогнози прогнозуються як рівні середнього арифметичного спостережуваних значень.) MEAN навіть перевершує ARIMA у трьох використаних нами рядах. Що я хочу знати, якщо це незвично? Чи …

3
Як працює наближення сідлових точок?
Як працює наближення сідлових точок? Для якої проблеми це добре? (Сміливо використовуйте конкретний приклад або приклади для ілюстрації) Чи є якісь недоліки, труднощі, на що слід звернути увагу, чи пастки для необережних?

3
Настанова щодо вибору гіперпараметрів у програмі глибокого навчання
Я шукаю документ, який міг би допомогти в наданні настанови про те, як вибрати гіперпараметри глибокої архітектури, як-от складені автокодери або глибокі мережі. Гіперпараметрів дуже багато, і я дуже розгублений у тому, як їх вибрати. Також використання перехресної перевірки не є можливим, оскільки навчання дійсно займає багато часу!

1
Розрахований вручну
Я знаю, що це досить специфічне Rзапитання, але я, можливо, думаю про відхилення в пропорції, пояснене, , неправильно. Ось іде.R2R2R^2 Я намагаюся використовувати Rпакет randomForest. У мене є деякі дані про навчання та дані тестування. Коли я підходить до випадкової лісової моделі, ця randomForestфункція дозволяє вводити нові дані тестування для …

3
Інтернет проти офлайн навчання?
Яка різниця між офлайн і онлайн-навчанням ? Це лише питання навчання за всім набором даних (офлайн) порівняно з навчанням поступово (по одному екземпляру)? Які приклади алгоритмів використовуються в обох?

4
Що таке інваріантність перекладу в комп'ютерному зорі та конволюційній нейромережі?
У мене немає фону з комп’ютерним зором, але коли я читаю деякі статті та документи, пов'язані з обробкою зображень та конволюційними нейронними мережами, постійно стикаюся з терміном translation invariance, або translation invariant. Або я читаю багато, що забезпечує згортання translation invariance? !! що це означає? Я сам завжди перекладав це …

3
Застосовуйте вбудовування слів до всього документа, щоб отримати вектор функції
Як я можу використовувати вбудовуване слово для зіставлення документа на функціональний вектор, придатний для використання під контролем навчання? Слово вкладення відображає кожне слово до вектору , де деякі не дуже велика кількість (наприклад, 500). Популярні вбудовані слова включають word2vec та Glove .шшwv ∈ Rгv∈Rгv \in \mathbb{R}^dггd Я хочу застосувати контрольоване …

2
A / B тести: z-test vs t-test vs chi square vs test точний тест
Я намагаюся зрозуміти міркування, вибираючи конкретний тестовий підхід при роботі з простим тестом A / B - (тобто, два варіанти / групи з бінарним відповіддю (перетвореним чи ні). Як приклад я буду використовувати дані нижче Version Visits Conversions A 2069 188 B 1826 220 Верхня відповідь тут чудова і говорить …

3
Які відмінності між "епохою", "партією" та "міні-партією"?
Наскільки мені відомо, коли приймається Stochastic Gradient Descent як алгоритм навчання, хтось використовує 'epoch' для повного набору даних та 'batch' для даних, що використовуються в одному кроці оновлення, в той час як інший використовує відповідно 'batch' і 'minibatch', і інші використовують "епоху" та "міні-серію". Це приводить до великої плутанини під …

1
PCA та кореспондентський аналіз у їхньому відношенні до Біплота
Біплот часто використовується для відображення результатів аналізу основних компонентів (та відповідних методик). Це подвійне або накладення розсіювання показуючи компонентів навантаження і компонентів оцінки одночасно. Сьогодні мене повідомив @amoeba, що він дав відповідь, відходячи від мого коментаря, на запитання, яке запитує про те, як виробляються / масштабуються координати біплотів; і його …

3
Випадкове число-Set.seed (N) у R [дублікат]
На це питання вже є відповідь тут: Що саме є насінням у генераторі випадкових чисел? 3 відповіді Я усвідомлюю, що set.seed()в R використовується один для генерації псевдовипадкових чисел. Я також усвідомлюю, що використовуючи ту саму кількість, як set.seed(123)страхує, ви можете відтворити результати. Але те, чого я не отримую, - це …

2
Інтерпретація виходу R для біноміальної регресії
Я досить новий у цьому тесті з біноміальними даними, але мені потрібно було зробити це, і тепер я не знаю, як інтерпретувати результат. Y-змінна, змінна відповіді, є біноміальною, а пояснювальні фактори - безперервними. Ось що я отримав під час підведення підсумків: glm(formula = leaves.presence ~ Area, family = binomial, data …

3
Виведення варіації коефіцієнта регресії в простій лінійній регресії
У простій лінійній регресії маємо y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u , де u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . Я отримав оцінювач: β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , деx¯x¯\bar{x} іy¯y¯\bar{y} - вибіркові засобиxxxіyyy. Тепер я хочу , щоб знайти дисперсію …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.