Чому ми не використовуємо значні цифри?


18

Будь-яка ідея, чому ми не використовуємо значних цифр у статистиці? Щось у цьому напрямку ми використовуємо кошториси, щоб правила щодо точності не застосовувалися;)?



Я знайшов це інформативно: davegiles.blogspot.com/2011/12/…
Іван

Приклад, коли звернення уваги на значущі цифри дійсно має значення, з’являється на сайті stats.stackexchange.com/questions/113314 , де ОП отримала помітно різні результати регресії, які можна простежити за відмінностями в точності, з якою дані були внесені до процедур регресії.
whuber

Відповіді:


19

Значні цифри використовуються в деяких полях (я дізнався про них з хімії) для позначення ступеня значущої точності, яка існує в ряді. Це важлива тема і в статистиці, тому насправді ми повідомляємо про це постійно - просто повідомляємо про це в іншій формі. Зокрема, ми повідомляємо про довірчі інтервали , які вказують на рівень точності оцінки (наприклад, середнє значення).

Після того, як ви перерахували 95% ІС для оцінки, такої як , ви можете перерахувати стільки цифр для вашого середнього значення, як, наприклад, 0.50129519823975923 , і немає ніяких проблем. Насправді, статистик Ендрю Гельман рекомендував вам перерахувати щонайменше чотири (2009, стор. 4) . (0.12,1.12)0.50129519823975923


(Остання частина - язик у щоках, вибачте за мою неповагу ;-).
gung - Відновіть Моніку

2
+1. Здається, що велика кількість цифр породжує неповажні відповіді: див. Останні кілька рядків моєї відповіді на подібне запитання на іншому веб-сайті SE.
whuber

@gung Як ​​ви вирішили представити кінцеві точки CI двома десятковими знаками?
користувач765195

@ user765195, я змінив ці цифри. Насправді ні до чого не посилаються.
gung - Відновіть Моніку

@gung Що я мав на меті запитати, що це точність кінцевих точок КІ? Скільки цифр є припустимими, скажімо, коли ви обчислюєте КІ Уілсона для двочленної пропорції?
користувач765195

12

Одна з причин обмеження кількості цифр, повідомлених у багатьох оцінках, p-значеннях тощо, ґрунтується на сприйнятті. Повідомлення про щось на зразок p = 0,04872429 передбачає рівень точності в результатах, що змушує сприймати їх як більш точні .

По суті, використання великої кількості цифр у поданні статистичних результатів викликає надто багато спроб приховати свої висновки в незаслуженому просторі влади.


1

Я думаю, що це дійсно залежить від необхідного рівня впевненості, менша кількість значущості підходить для 95%, на відміну від 99,999% або більше, наприклад, як використовується ЦЕРН у багатьох своїх результатах.


Для подальшого з’ясування стаття Вікіпедії про точність та точність допоможе прочитати оригінальний плакат.
Роберт Джонс

це хороший момент, але навіть коли округлення 𝛂 = .05 у певних обчисленнях може мати великий вплив на результат.
timothy.s.lau

1

Ви говорите про округлення ваших даних до деякої кількості значущих цифр або округлення остаточної відповіді? Якщо ви округляєте свої дані, ви можете потрапити в ситуації, коли ви викинули шум, який потрібно використовувати статистичні розрахунки.


Я маю на увазі як остаточні відповіді, так і серединні обчислення, як правило, округлені навіть у підручниках.
timothy.s.lau
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.