Запитання з тегом «descriptive-statistics»

Описова статистика узагальнює особливості вибірки, такі як середні та стандартні відхилення, медіана та квателі, максимум та мінімум. З декількома змінними може включати кореляції та перехресні вкладки. Може включати візуальні дисплеї - боксплоти, гістограми, розсіювачі тощо.

12
Інструмент командного рядка для обчислення базової статистики для потоку значень [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . Чи є інструмент командного рядка, який приймає потік чисел (у форматі ascii) зі стандартного введення та дає основні описові статистичні дані для цього …

3
Що можна зробити висновок про дані, коли середнє арифметичне дуже близьке до середнього геометричного?
Чи є щось значне щодо середнього геометричного та середнього арифметичного, що падають дуже близько один до одного, скажімо, ~ 0,1%? Які підказки можна зробити щодо такого набору даних? Я працював над аналізом набору даних, і зауважую, що за іронією долі значення дуже і дуже близькі. Не точно, але близько. Крім …

5
Чи важливий дослідницький аналіз даних при чисто передбачуваному моделюванні?
Під час побудови прогностичної моделі з використанням машинних методів навчання, який сенс робити дослідницький аналіз даних (EDA)? Чи добре переходити безпосередньо до генерації функцій та будувати свої моделі? Наскільки важлива описова статистика, яка використовується в EDA?


4
Який сенс звітності про описову статистику?
Я щойно провів аналіз своїх даних за допомогою логістичної регресії, однак мені також потрібно мати описову частину статистики у своєму звіті. Я, чесно кажучи, не бачу сенсу в цьому, і я сподівався, що хтось, можливо, зможе пояснити, чому це потрібно. Наприклад, якщо я побудую гістограму однієї з моїх незалежних безперервних …

1
Anscombe-подібні набори даних із тим самим графіком вікон і вусів (середнє / std / медіан / MAD / хв / макс)
EDIT: Оскільки це питання завищене, підсумок: пошук різних значущих та інтерпретованих наборів даних із однаковою змішаною статистикою (середня, середня, середня та їх пов’язана дисперсія та регресія). Квартет Anscombe (див. Призначення візуалізації даних високих розмірів? ) - відомий приклад чотирьох наборів даних - , з однаковим граничним середнім / стандартним відхиленням …

6
Яка різниця між описовою та інфекційною статистикою?
Моє розуміння полягало в тому, що описова статистика кількісно описує особливості вибірки даних, тоді як інфекційна статистика робила висновки про популяції, з яких брали зразки. Однак на сторінці вікіпедії для статистичного висновку зазначено: Здебільшого статистичні умовиводи висловлюють положення про популяції, використовуючи дані, отримані від сукупності, що цікавить, за допомогою якоїсь …

4
Що означає "неупередженість"?
Що означає сказати, що "дисперсія - це упереджений оцінювач". Що означає перетворення упередженої оцінки в неупереджену оцінку за допомогою простої формули. Що саме робить це перетворення? Також, яке практичне використання цього перетворення? Чи конвертуєте ви ці бали, використовуючи статистику певного виду?

2
Обчислення стандартної помилки після log-перетворення
Розглянемо випадковий набір чисел, які зазвичай розподіляються: x <- rnorm(n=1000, mean=10) Ми хотіли б знати середню та стандартну помилки середньої величини, тому робимо наступне: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units Чудово! Однак припустимо, що ми не обов'язково знаємо, …

3
Як я можу обчислити довірчий інтервал середнього значення в не нормально розподіленій вибірці?
Як я можу обчислити довірчий інтервал середнього значення в не нормально розподіленій вибірці? Я розумію, що тут зазвичай використовуються методи завантаження, але я відкритий для інших варіантів. Хоча я шукаю непараметричний варіант, якщо хтось може переконати мене, що параметричне рішення є дійсним, це було б добре. Розмір вибірки> 400. Якщо …

5
Інтуїція (геометрична чи інша)
Розглянемо елементарну ідентичність дисперсії: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} Це проста алгебраїчна маніпуляція визначення центрального моменту на нецентральні моменти. Це дозволяє зручно маніпулювати в інших контекстах. Він також дозволяє обчислити дисперсію за допомогою одного проходу над даними, а не через два …

4
Неперехідність кореляції: кореляція між статтю та розміром мозку та розміром мозку та IQ, але немає кореляції між статтю та IQ
У блозі я знайшов таке пояснення, і хотів би отримати більше інформації про неперехідність кореляції: У нас є такі незаперечні факти: В середньому різниця в обсязі мозку між чоловіками і жінками Існує кореляція між IQ та розміром мозку; кореляція становить 0,33 і, таким чином, відповідає 10% варіабельності IQ З цих …

5
Яку підсумкову статистику використовувати для категоричних чи якісних змінних?
Просто для уточнення, коли я маю на увазі підсумкову статистику, я маю на увазі середній, середній квартільний діапазон, дисперсія, стандартне відхилення. Підсумовуючи однозначний, який є категоричним або якісним , враховуючи і номінальний, і ординарний випадки, чи є сенс знаходити його середній, медіанний, четвертичний діапазони, дисперсію та стандартне відхилення? Якщо так, …


3
Чим відрізняється "статистичний експеримент" від "статистичної моделі"?
Я стежу за AW van der Vaart, асимптотичною статистикою (1998). Він розповідає про статистичні експерименти, стверджуючи, що вони відрізняються від статистичної моделі, але не визначає жодного. Моє запитання: Що таке (1) статистичний експеримент, (2) статистична модель та (3), що є ключовим інгредієнтом, який завжди відрізнятиме статистичний експеримент від будь-якої статистичної …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.