Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

30
Що таке загальні статистичні гріхи?
Я студентка психології, і, як я все більше і більше займаюся незалежними дослідженнями статистики, все більше вражаю неадекватність моєї формальної підготовки. Як особистий досвід, так і досвід другого боку свідчить про те, що нестабільність статистичної суворості в бакалаврській та випускній підготовці є досить всюдисущою в психології. Тому я вважав, що …
227 fallacy 

11
Чи є якась причина віддавати перевагу AIC або BIC перед іншими?
AIC і BIC - це обидва методи оцінки відповідності моделі, що штрафується за кількістю оцінюваних параметрів. Наскільки я розумію, BIC карає моделі більше за вільні параметри, ніж AIC. Крім переваг, що ґрунтуються на строгості критеріїв, чи є інші причини віддати перевагу AIC перед BIC або навпаки?

5
Розмір партії компромісу порівняно з кількістю ітерацій для тренування нейронної мережі
Тренуючи нейронну мережу, яку різницю має встановити: розмір партії до і кількість повторень bаaaбbb порівняно з розміром партії до та кількістю повторень dcccгdd де ?a b = c dab=cd ab = cd Інакше кажучи, припускаючи, що ми навчаємо нейронну мережу з однаковою кількістю прикладів тренувань, як встановити оптимальний розмір партії …

14
Які відмінності між факторним аналізом та аналізом основних компонентів?
Схоже, що ряд статистичних пакетів, які я використовую, поєднує ці два поняття разом. Однак мені цікаво, чи існують різні припущення чи "формальності" даних, які повинні бути правдивими, щоб використовувати одне за іншим. Справжній приклад був би неймовірно корисним.

12
Яка різниця між обробкою даних, статистикою, машинним навчанням та ШІ?
Яка різниця між обробкою даних, статистикою, машинним навчанням та ШІ? Чи було б точно сказати, що це 4 поля, які намагаються вирішити дуже схожі проблеми, але з різними підходами? Що саме вони мають спільне і чим вони відрізняються? Якщо між ними існує якась ієрархія, що це було б? Подібні запитання …

3
Як дізнатися, що проблема з машинним навчанням безперспективна?
Уявіть стандартний сценарій машинного навчання: Ви стикаєтесь з великим багатофакторним набором даних і маєте досить розмите розуміння цього. Що вам потрібно зробити, це зробити передбачення щодо якоїсь змінної на основі того, що у вас є. Як завжди, ви очищаєте дані, переглядаєте описову статистику, запускаєте деякі моделі, перехресне підтверджуєте їх тощо, …

10
Як би ви пояснили коваріантність тому, хто розуміє лише середину?
... припускаючи, що я в змозі інтуїтивно збільшити свої знання про дисперсію ( розуміння "дисперсії" ) або кажучи: це середня відстань значень даних від "середнього" - а оскільки дисперсія знаходиться у квадраті одиниць, беремо квадратний корінь, щоб зберегти одиниці однакові, і це називається стандартним відхиленням. Припустимо, що це багато сформульовано …

5
Яке «середнє» значення використовувати і коли?
Отже, маємо середнє арифметичне (AM), середнє геометричне (GM) і середнє гармонічне (HM). Їх математичне формулювання також добре відоме разом із пов’язаними з ними стереотипними прикладами (наприклад, середнє значення гармонії та його застосування для проблем, пов'язаних із швидкістю). Однак питання, яке мене завжди заінтригувало, - це "як я вирішую, яке значення …
197 mean 

8
Алгоритми автоматичного вибору моделі
Я хотів би реалізувати алгоритм автоматичного вибору моделі. Я думаю про поступову регресію, але все, що буде робити (він повинен базуватися на лінійних регресіях). Моя проблема полягає в тому, що я не в змозі знайти методологію чи реалізацію з відкритим кодом (я прокидаюся в Java). Я маю на увазі методологію: …


12
Як слід перетворювати негативні дані, включаючи нулі?
Якщо у мене є дуже перекошені позитивні дані, я часто беру журнали. Але що мені робити із сильно перекривленими негативними даними, що включають нулі? Я бачив дві трансформації: який має чітку функцію, яка 0 відображає до 0.журнал( х + 1 )log⁡(x+1)\log(x+1) де c оцінюється або встановлюється як дуже невелике додатне …

4
Що обчислює прихований шар у нейронній мережі?
Я впевнений, що багато людей відгукнуться посиланнями на тему "дозвольте мені погуглювати це для вас", тому я хочу сказати, що я намагався розібратися в цьому, тож, пробачте, пробачте моє нерозуміння тут, але я не можу зрозуміти, як практична реалізація нейронної мережі насправді працює. Я розумію вхідний шар і як нормалізувати …


15
Що таке вчений?
Нещодавно закінчивши докторську програму зі статистики, я останні пару місяців почав шукати роботу в галузі статистики. Майже в кожній компанії, яку я вважав, була посада з посадою « Науковець даних ». Насправді, здавалося, давно минули дні побачень звань посади вченого- статистика чи статистика . Якби науковець даних дійсно замінив те, …

4
Який розмір партії в нейронній мережі?
Я використовую Python Keras packageдля нейронної мережі. Це посилання . Чи batch_sizeдорівнює кількості тестових зразків? З Вікіпедії ми маємо цю інформацію: Однак в інших випадках для оцінки градієнта суми можуть знадобитися дорогі оцінки градієнтів з усіх функцій підсумовування. Коли навчальний набір величезний і не існує простих формул, оцінка сум градієнтів …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.