Запитання з тегом «statistics»

Поміркуйте, чи краще ваше питання задати на https://stats.stackexchange.com. Статистика - це математичне вивчення використання ймовірності для висновку характеристик популяції з обмеженої кількості вибірок або спостережень.

8
Чи швидший і легший Python, ніж C ++? [зачинено]
В даний час це питання не підходить для нашого формату запитань та відповідей. Ми очікуємо, що відповіді будуть підтверджені фактами, посиланнями чи експертизою, але це питання, швидше за все, вимагатиме дебатів, аргументів, опитування чи розширеного обговорення. Якщо ви вважаєте, що це питання можна покращити і, можливо, знову відкрити, відвідайте довідковий …

13
Статистику коміту Git легко отримати
Раніше я користувався можливістю TortoiseSvn генерувати просту статистику комітів для даного сховища SVN. Цікаво, що є в Git, і мене особливо цікавить: Кількість коміт на одного користувача Кількість рядків, змінених на одного користувача активність у часі (наприклад, сукупні щотижневі зміни) Будь-які ідеї?


3
Чи існує хороша бібліотека математики / статистики для Scala? [зачинено]
Зачинено. Це питання не відповідає вимогам щодо переповнення стека . Наразі відповіді не приймаються. Хочете покращити це питання? Оновіть питання, щоб воно було актуальним для переповнення стека. Закрито 2 роки тому . Удосконалюйте це питання Я шукаю хорошу бібліотеку з відкритим кодом для шкали математики та статистики. Сподіваємось, щось на …
88 scala  math  statistics 

12
Як побудувати криву ROC в Python
Я намагаюся побудувати криву ROC для оцінки точності моделі прогнозування, яку я розробив у Python, використовуючи пакети логістичної регресії. Я розрахував істинний позитивний показник, а також хибнопозитивний показник; однак я не можу зрозуміти, як правильно скласти їх, використовуючи matplotlibта обчислити значення AUC. Як я міг це зробити?

14
Як ефективно розрахувати стандартне відхилення, що працює?
У мене є масив списків чисел, наприклад: [0] (0.01, 0.01, 0.02, 0.04, 0.03) [1] (0.00, 0.02, 0.02, 0.03, 0.02) [2] (0.01, 0.02, 0.02, 0.03, 0.02) ... [n] (0.01, 0.00, 0.01, 0.05, 0.03) Я б хотів ефективно розрахувати середнє та стандартне відхилення для кожного індексу списку для всіх елементів масиву. Щоб …

13
«Он-лайн» (ітератор) алгоритми для оцінки статистичної медіани, режиму, перекосу, ексцентричності?
Чи існує алгоритм для оцінки медіани, режиму, перекосу та / або ексцентричності набору значень, але який НЕ вимагає зберігання всіх значень відразу в пам'яті? Я хотів би розрахувати основні статистичні дані: середнє: середнє арифметичне дисперсія: середнє значення квадратичних відхилень від середнього стандартне відхилення: квадратний корінь з дисперсії медіана: значення, яке …

9
Квантильно-квантильний графік за допомогою SciPy
Як би ви створили qq-графік за допомогою Python? Припускаючи, що у вас великий набір вимірювань і ви використовуєте якусь функцію побудови графіків, яка приймає значення XY як вхідні дані. Функція повинна будувати квантилі вимірювань щодо відповідних квантилів певного розподілу (нормального, рівномірного ...). Отриманий графік дозволяє нам потім оцінити, коли ми …

3
Що саме робить numpy.exp ()? [зачинено]
Зачинено. Це питання не відповідає вимогам щодо переповнення стека . Наразі відповіді не приймаються. Хочете покращити це питання? Оновіть питання, щоб воно було актуальним для переповнення стека. Закрито 5 років тому . Удосконалюйте це питання Я дуже розгублений щодо того, що насправді робить np.exp (). У документації сказано: "Обчислює експоненцію …
84 python  numpy  statistics  exp 

2
Двовибірковий тест Колмогорова-Смірнова в Python Scipy
Я не можу зрозуміти, як зробити тест із двома зразками KS у Scipy. Після прочитання документації scipy kstest Я бачу, як перевірити, де розподіл ідентичний стандартному звичайному розподілу from scipy.stats import kstest import numpy as np x = np.random.normal(0,1,1000) test_stat = kstest(x, 'norm') #>>> test_stat #(0.021080234718821145, 0.76584491300591395) Це означає, що …


1
Статистичні показники суто функціональних карт і наборів
Враховуючи специфікацію структури даних, таку як чисто функціональна карта з відомими межами складності, потрібно вибирати між кількома реалізаціями. Існує деякий фольклор про те, як вибрати правильний, наприклад, червоно-чорні дерева вважаються загалом швидшими, але дерева AVL мають кращі показники на робочих навантаженнях з великою кількістю пошуків. Чи існує систематична презентація (опублікована …

1
Як я можу використовувати команду `td` з пакету` tempdisagg` для розбиття щомісячних даних на щоденну частоту даних?
У мене є щомісячні дані про частоту, які я намагаюся розділити на щоденні дані частоти. Тому я використовую tdкоманду з tempdisaggпакета в R, використовуючи код нижче: dat=ts(data[,2]) result=td(dat~1, conversion = "average", to = "day", method = "chow-lin-maxlog") Тоді я отримую таке повідомлення про помилку: Error in td(dat ~ 1, conversion …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.