Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

1
Як визначити, чи має вісь y починатись з нуля?
Одним із поширених способів "лежати з даними" є використання шкали по осі y, завдяки якій здається, що зміни є більш істотними, ніж вони є насправді. Переглядаючи наукові публікації чи доповіді в лабораторіях, мене часто засмучує цей "гріх візуалізації даних" (який, на мою думку, автори вчиняють ненавмисно, але все ж призводить …

1
Різниця між GradientDescentOptimizer та AdamOptimizer (TensorFlow)?
Я написав простий MLP в TensorFlow, який моделює XOR-ворота . Отже для: input_data = [[0., 0.], [0., 1.], [1., 0.], [1., 1.]] він повинен виробляти наступне: output_data = [[0.], [1.], [1.], [0.]] Мережа має вхідний шар, прихований шар та вихідний шар з 2, 5 та 1 нейроном кожен. В даний …

6
Які основні теореми машинного (глибокого) навчання?
Нещодавно Аль-Рахімі виступив із дуже провокаційною розмовою в NIPS 2017, порівнюючи сучасне машинне навчання з алхімією. Одне з його тверджень полягає в тому, що нам потрібно повернутися до теоретичних розробок, мати прості теореми, що підтверджують основоположні результати. Коли він це сказав, я почав шукати основні теореми для ML, але не …

2
Лінійне ядро ​​та нелінійне ядро ​​для підтримуючої векторної машини?
Використовуючи векторну машину підтримки, чи є якісь вказівки щодо вибору лінійного ядра проти нелінійного ядра, наприклад, RBF? Я колись чув, що нелінійне ядро, як правило, не працює добре, коли кількість функцій велика. Чи є посилання на це питання?

3
Який ефект має співвіднесення предикторів у моделі множинної регресії?
У моєму класі лінійних моделей я дізнався, що якщо два предиктори співвідносяться і обидва будуть включені в модель, один буде незначним. Наприклад, припустимо, що розмір будинку та кількість спалень співвідносяться. При прогнозуванні вартості будинку з використанням цих двох прогнозів один з них може бути відхилений, оскільки вони обидва надають багато …

2
Як моделювати штучні дані для логістичної регресії?
Я знаю, що мені щось не вистачає в моєму розумінні логістичної регресії, і я дуже вдячний за будь-яку допомогу. Наскільки я розумію, логістична регресія передбачає, що ймовірність результату '1' за даними входів є лінійною комбінацією входів, переданих через функцію обернено-логістичної. Це є прикладом у наступному R-коді: #create data: x1 = …

10
Як правильно побудувати тенденції
Я створюю графік, щоб показати тенденції рівня смертності (на 1000 ppl) у різних країнах, і історія, яка повинна виходити з сюжету, полягає в тому, що Німеччина (світло-синя лінія) є єдиною, чия тенденція зростає після 1932 року. Це моя перша (основна) спроба На мою думку, цей графік вже показує те, що …

8
Чи є золотий стандарт для моделювання нерегулярно розташованих часових рядів?
У галузі економіки (я думаю) у нас є ARIMA та GARCH для регулярно розподілених часових рядів, а Пуассон, Хоукс для моделювання точкових процесів, тож як щодо спроб моделювання нерегулярних (нерівномірно) проміжок часу - чи існують (принаймні) загальні практики ? (Якщо у вас є деякі знання з цієї теми, ви також …


5
Використання R в Інтернеті - без його встановлення [закрито]
Чи існує можливість використання R у вебінтерфейсі без необхідності його встановлення? У мене є лише один невеликий сценарій, який я люблю запускати, але я просто хочу його зняти без тривалої процедури установки. Дякую.
45 r 

3
Що таке Девіант? (конкретно в CART / rpart)
Що таке "Відхилення", як він обчислюється та якими є його використання в різних галузях статистики? Зокрема, мене особисто цікавить його використання в CART (та його реалізація в rpart in R). Я запитую це, оскільки вікі-статті здається дещо відсутнім, і Ваша думка буде найкраще вітатися.
45 r  cart  rpart  deviance 

15
Очікувана кількість співвідношення народжуваності дівчаток та хлопчиків
Я натрапив на тест на придатність до співбесіди для критичного мислення. Це щось подібне: У Зорянській Республіці є дуже дивні звичаї. Пари бажають мати дітей-жінок, оскільки тільки жінки можуть успадкувати багатство сім'ї, тому якщо вони мають дитину-чоловіка, вони продовжують мати більше дітей, поки не матимуть дівчинку. Якщо у них є …

1
Як працює метод Адама стохастичного градієнтного спуску?
Мені знайомі основні алгоритми спуску градієнта для навчання нейронних мереж. Я прочитав документ, що пропонує Адаму: АДАМ: МЕТОД СТОХАСТИЧНОЇ ОПТИМІЗАЦІЇ . Хоча я, безумовно, отримав деяку інформацію (принаймні), папір здається мені занадто високим рівнем. Наприклад, функція витрат часто є сумою безлічі різних функцій, тому для оптимізації її значення необхідно зробити …


2
Наскільки добре може багатократна регресія справді «контролювати» коваріати?
Всі ми знайомі із спостережними дослідженнями, які намагаються встановити причинно-наслідковий зв’язок між нерандомізованим передбачувачем X та результатом, включивши кожного можливого потенційного учасника в модель множинної регресії. Таким чином, «контролюючи» всіх плутанин, аргумент іде, ми виокремлюємо дію інтелектуального прогноза. У мене виникає все більший дискомфорт від цієї ідеї, що ґрунтується, головним …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.