Статистика та великі дані

Питання та відповіді для людей, зацікавлених у статистиці, машинному навчанні, аналізі даних, інтелектуальному аналізу даних та візуалізації даних

3
Чи існують функції за замовчуванням для дискретних рівномірних розподілів у R?
Більшість стандартних розподілів у R мають сімейство команд - pdf / pmf, cdf / cmf, quantile, випадкові відхилення (наприклад, dnorm, pnorm, qnorm, rnorm). Я знаю, що досить просто використовувати деякі стандартні команди для відтворення цих функцій для дискретних рівномірних розподілів, але чи вже є вподобане сімейство функцій для моделювання дискретних …

5
Вимірювання "відстані" між двома багатоваріантними розподілами
Я шукаю хорошу термінологію, щоб описати те, що намагаюся зробити, щоб полегшити пошук ресурсів. Скажімо, у мене є два кластери точок A і B, кожне пов'язане з двома значеннями, X і Y, і я хочу виміряти "відстань" між A і B - тобто наскільки ймовірним є те, що вони були …

3
Ознайомлення з інформацією про часовий ряд з R
Якщо ви задумаєтесь, до того, коли ви вперше почали з аналізу часових рядів. Про які інструменти, пакети R та Інтернет-ресурси ви хочете, щоб ви знали? Що я намагаюся запитати - це з чого слід починати? Зокрема, чи існують ресурси для R, які справді зводять його для того, хто є "новим" …
28 r  time-series 

6
Статистика / Вірогідні відео для початківців
Вже був запит на відео з математичної статистики , але він чітко просив людей відеоролики, які забезпечують суворий математичний виклад статистики. тобто відео, які можуть супроводжувати курс, який використовує підручник, згаданий у цій дискусії про ... Тож водночас мені цікаво, яку рекомендацію ви маєте щодо stat / prob - 101 …
28 references 

5
Будь-які пропозиції щодо створення коду R використовувати декілька процесорів?
У мене є R-скрипти для читання великої кількості даних CSV з різних файлів, а потім для виконання завдань машинного навчання, таких як svm для класифікації. Чи є бібліотеки для використання декількох ядер на сервері для Р. або Який найбільш підходящий спосіб досягти цього?

6
Які альтернативи зламаним осям?
Користувачі часто спокушаються розбити значення осі, щоб представити дані різних порядків на одному графіку (див. Тут ). Хоча це може бути зручно, це не завжди кращий спосіб відображення даних (може бути в омані в кращому випадку). Які альтернативні способи відображення даних, які відрізняються за кількома порядками? Я можу придумати два …

8
Як зобразити необмежену змінну як число між 0 і 1
Я хочу представити змінну у вигляді числа між 0 і 1. Змінна є невід'ємним цілим числом, не притаманним пов'язаним. Я відображаю 0 до 0, але що я можу зіставити з 1 або цифрами між 0 і 1? Я міг би використовувати історію цієї змінної, щоб забезпечити обмеження. Це означатиме, що …


26
Які пакети R ви вважаєте найбільш корисними у своїй щоденній роботі?
Заблокований . Це питання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Дублікат потоку: я щойно встановив останню версію R. Які пакунки потрібно отримати? Які R- пакети ви не уявляли щоденної роботи з даними? Перерахуйте, як загальні, так …
28 r 

2
Чому середньоквадратична помилка є перехресною ентропією між емпіричним розподілом та гауссова модель?
У 5.5, « Глибоке навчання» (Ian Goodfellow, Yushua Bengio та Aaron Courville), він стверджує, що Будь-яка втрата, що складається з негативної логічної ймовірності, є перехресною ентропією між емпіричним розподілом, визначеним навчальним набором, та розподілом ймовірностей, визначеним моделлю. Наприклад, середня помилка у квадраті - це перехресна ентропія між емпіричним розподілом та …

4
Навіщо використовувати кольорову карту viridis над струменем?
Як було оголошено в https://www.youtube.com/watch?v=xAoljeRJ3lU , Matplotlib змінює кольорову карту за замовчуванням з реактивної на viridis. Однак я це не дуже добре розумію. Можливо тому, що я кольоровий? Оригінальний струмінь кольорової карти виглядає дуже сильним, я відчуваю контраст: У той час як у новій кольоровій карті viridis не вистачає цього …

1
Красиво написані папери
З книги Девіда Сальсбурга Дама дегустує чай : Хоча читач може не повірити, літературний стиль відіграє важливу роль у математичному дослідженні. Деякі математичні письменники здаються нездатними створити статті, які легко зрозуміти. Інші, здається, отримують перекручене задоволення від створення багатьох рядків символічної нотації, настільки наповнених деталями, що загальна ідея втрачається в …

5
Чому дисперсія ходи випадкових збільшується?
Випадкова прогулянка , яка визначається як Yт= Yt - 1+ етYt=Yt−1+etY_{t} = Y_{t-1} + e_t , де етete_t є білим шумом. Позначає, що поточна позиція - це сума попередньої позиції + непередбачуваний термін. Можна довести , що середня функція мкт= 0μt=0\mu_t = 0 , так як Е( Yт) = Е( …

6
З точки зору неспеціалістів, чим відрізняється модель і розподіл?
Відповіді (визначення), визначені у Вікіпедії, є, мабуть, трохи критиками для тих, хто не знає вищу математику / статистику. У математичних термінах, статистична модель зазвичай вважаються як пара ( ), де S є безліч можливих спостережень, тобто вибіркового простору, а P являє собою безліч імовірнісних розподілів на S .S, СS,PS, \mathcal{P}SSSПP\mathcal{P}SSS …

6
Навіщо нам потрібна багатоваріантна регресія (на відміну від ряду одноманітних регресій)?
Я щойно переглянув цю чудову книгу: Прикладний багатоваріантний статистичний аналіз Джонсона та Вічерн . Іронія полягає в тому, що я досі не в змозі зрозуміти мотивацію використання багатоваріантних (регресійних) моделей замість окремих одновимірних (регресійних) моделей. Я переглянув stats.statexchange пости 1 та 2, які пояснюють (a) різницю між багаторазовою та багатоваріантною …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.