Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

27
Парадокс сплячої краси
Ситуація Деякі дослідники хотіли б укласти вас спати. Залежно від таємного кидання справедливої ​​монети, вони ненадовго пробудять вас або один раз (Голова), або двічі (Хвости). Після кожного пробудження вони повернуть вас спати з препаратом, який змушує забути це пробудження. Коли ви прокидаєтесь, до якої міри ви повинні вірити, що результатом …

8
Чому метод Ньютона не широко застосовується в машинному навчанні?
Це те, що мене клопоче якийсь час, і я не зміг знайти задовільних відповідей в Інтернеті, тож ось: Переглянувши набір лекцій з питань опуклої оптимізації, метод Ньютона, здається, є значно кращим алгоритмом, ніж градієнтне сходження, щоб знайти глобально оптимальні рішення, тому що метод Ньютона може забезпечити гарантію його рішення, він …

4
Копена Коена на звичайній англійській мові
Я читаю книгу обміну даними, і в ній згадується статистика Kappa як засіб для оцінки ефективності прогнозування класифікаторів. Однак я просто не можу цього зрозуміти. Я також перевірив Вікіпедію, але це теж не допомогло: https://en.wikipedia.org/wiki/Cohen's_kappa . Як Каппа Коена допомагає оцінювати ефективність прогнозування класифікаторів? Що це говорить? Я розумію, що …

14
Чи великі набори даних не підходять для тестування гіпотез?
В недавній статті в Amstat Новини , автори (Марк ван дер Лан і Шеррі Роуз) заявив , що «Ми знаємо , що для досить великих розмірів вибірки, кожне дослідження, в тому числі ті , в яких нульова гіпотеза про відсутність ефекту вірно - буде оголосити статистично значущий ефект. " Ну, …

6
Яка різниця між дисперсією та стандартним відхиленням?
Мені було цікаво, чим відрізняється дисперсія від стандартного відхилення. Якщо обчислити два значення, зрозуміло, що ви отримуєте стандартне відхилення від дисперсії, але що це означає з точки зору розподілу, який ви спостерігаєте? Крім того, навіщо вам справді потрібне стандартне відхилення?

9
Знизу вгорі пояснення відстані махаланобіса?
Я вивчаю розпізнавання образів і статистику, і майже кожна книга, яку я відкриваю на тему, натрапляю на концепцію відстані махаланобіса . Книги дають свого роду інтуїтивні пояснення, але все ще недостатньо хороші для мене, щоб насправді зрозуміти, що відбувається. Якби хтось запитав мене: "Яка відстань махаланобіса?" Я могла відповісти лише: …

9
Отримання знань з випадкового лісу
Випадкові ліси вважаються чорними ящиками, але останнім часом я думав, які знання можна отримати з випадкового лісу? Найбільш очевидною є важливість змінних, у найпростішому варіанті це можна зробити, просто обчисливши кількість зустрічей змінної. Друге, про що я думав - це взаємодії. Я думаю, що якщо кількість дерев є достатньо великою, …

3
Чим відрізняється послідовний оцінювач від об'єктивного оцінювача?
Я дуже здивований, що ніхто, здається, вже не питав цього ... Під час обговорення оцінок два терміни, які часто використовуються, є "послідовними" та "неупередженими". Моє запитання просте: в чому різниця? Точні технічні визначення цих термінів досить складні, і важко зрозуміти, що вони означають . Я можу уявити собі хороший і …

3
Допоможіть мені зрозуміти байєсівські попередні та задні розподіли
У групі студентів є 2 з 18, які є лівшею. Знайдіть задній розподіл ліворуких студентів у популяції, припускаючи, що раніше неінформативний. Підсумуйте результати. За даними літератури 5-20% людей - лівші. Враховуйте цю інформацію в попередньому і обчислюйте нову задню. Я знаю, що тут слід використовувати бета-розподіл . По-перше, значення αα\alpha …

4
Яка різниця між згортковими нейронними мережами, обмеженими машинами Больцмана і автокодерами?
Останнім часом я читав про глибоке навчання, і мене бентежить термін (або, скажімо, технології). Яка різниця між Конволюційні нейронні мережі (CNN), Машини з обмеженим набором Больцмана (RBM) та Авто-кодери?

6
Кореляції з не упорядкованими категоричними змінними
У мене є кадр даних з багатьма спостереженнями та багатьма змінними. Деякі з них є категоричними (не упорядкованими), а інші - числовими. Я шукаю асоціацій між цими змінними. Мені вдалося обчислити кореляцію для числових змінних (кореляція Спірмена), але: Я не знаю, як виміряти співвідношення між невпорядкованими категоричними змінними. Я не …


3
Для чого нам потрібні сигма-алгебри для визначення просторів ймовірностей?
У нас є випадковий експеримент з різними результатами, що формують пробний простір на якому ми з цікавістю дивимось на певні шаблони, звані подіямиСигма-алгебри (або сигма-поля) складаються з подій, яким може бути призначений міра ймовірності . Виконуються певні властивості, включаючи включення нульового набору та всього вибіркового простору та алгебри, яка описує …

21
На кожному кроці обмежувального нескінченного процесу покладіть 10 кульок в урну і видаліть один навмання. Скільки кульок залишилось?
Питання (злегка модифіковане) йде наступним чином, і якщо ви ніколи не стикалися з ним, перш ніж ви можете перевірити його в прикладі 6а, глава 2, « Перший курс правдоподібності Шелдона Росса» : Припустимо, ми маємо нескінченно велику урну та нескінченну колекцію кульок з написом куля №1, №2, №3 тощо. Розглянемо …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.