Кількість значущих цифр, які потрібно повідомити


12

Чи існує більш науковий спосіб визначення кількості значущих цифр, які потрібно повідомити за середній або довірчий інтервал у ситуації, яка є досить стандартною - наприклад, перший рік в коледжі.

Я бачив Кількість значущих цифр , щоб помістити в таблицю , Чому ми не використовуємо значущі цифри і числа значущих цифр в хі - квадрат нападі , але вони , здається, не поклав палець на цю проблему.

На своїх заняттях я намагаюся пояснити студентам, що марно використовувати чорнило, щоб повідомити про 15 значущих цифр, коли вони мають таку широку стандартну помилку в своїх результатах - моє відчуття кишечника полягало в тому, що його слід округлювати приблизно десь із порядку . Це не надто відрізняється від того, що сказано в ASTM - звітних результатах тестів, що посилаються на E29, де вони кажуть, що це повинно бути від до .0.25σ0.05σ0.5σ

Редагувати:

Коли у мене є набір цифр, як xпоказано нижче, скільки цифр слід використати для друку середнього та стандартного відхилень?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

ЗАПИТАННЯ: Детально розкажіть, що таке точність (коли є вектор подвійних точних чисел) для середнього та стандартного відхилень у цьому і напишіть просту R педагогічну функцію, яка буде друкувати середнє та стандартне відхилення на значну кількість цифр, які відображається у векторі x.


Я не розумію, чому "Кількість значущих цифр, які слід помістити в таблицю" не відповідає повністю вашому запитанню: який момент пропускає це питання?
whuber

Мені подобається ваша відповідь на це питання @whuber, але я хотів би трохи детальніше.
Шон

1
Але детально про що? У будь-якому випадку, звучить так, що ваше запитання справді є точним дублікатом цього питання, і що ви хочете, щоб побачити вдосконалення його відповідей. Я прав? До речі, якщо ви шукаєте педагогічних вказівок, я хотів би вказати на один (спеціалізований) приклад, який я розмістив на сайті gis.stackexchange.com/questions/8650 щодо повідомлення географічних координат: ідея полягає в тому, щоб пов’язати числа значущих цифри з предметами, розміри яких більшість читачів легко та інтуїтивно зрозуміють. Подібний підхід може добре працювати в інших програмах.
whuber

1
@whuber так, ти прав, і мені це подобається. Я думаю, я шукаю більш детальну інформацію про те, як точність пов'язана зі стандартним відхиленням. Напр. В R, x <- rnorm (30); середнє значення (x); sd (x) # тут чітко sd приблизно 1, але в R середнє значення друкується за замовчуванням із 7 цифрами точності. sd (x) / 30 становить приблизно 0,18. Спасибі
Шон

Як R(як і майже все програмне забезпечення) друк контролюється глобальним значенням (див. options(digits=...)), А не будь-яким врахуванням точності.
качан

Відповіді:


9

Керівництво по невизначеності вимірювання (GUM) рекомендує повідомляти про невизначеність не більше ніж двома цифрами та повідомляти про результат із кількістю значущих цифр, необхідних для його узгодження з невизначеністю. Див. Розділ 7.2.2 нижче

http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf

Наступний код був моєю спробою реалізувати цю рекомендацію у Р. Ное, що R може не співпрацювати зі спробами зберегти відсталі нулі у виході, навіть якщо вони значні.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)

Для повноти: > gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340
rhombidodecahedron

@rhombidodecahedron не повинен непевність тут лише одну значну цифру? 82 ± 3 (× 10²)
jfs

@jfs рекомендація говорить про використання двох значущих показників у невизначеності, чи не так?
rhombidodecahedron

@rhombidodecahedron відповідь говорить "не більше 2" Критерії в GUM для мене незрозумілі. У таблиці 3 від arxiv.org/pdf/1301.1034.pdf пропонується 1 важлива цифра, яку потрібно повідомити для менш ніж 7 вимірювань.
jfs

Приклад коду не відповідає запропонованому правилу GUM. Якщо val = 8165.666і unc = 338.9741, то про вимірювання слід повідомити як val = 8.17(34)*10^3(а не val = 8170з unc = 340даними), щоб зрозуміти, що лише дві цифри невизначеності є значущими.
дівенекс

6

Якщо ви показуєте інтервал довіри, а також значення статистики, то немає жодної проблеми з тим, щоб дати стільки значущих цифр, скільки бажаєте, оскільки в цьому випадку велика кількість значущих цифр не передбачає помилкової точності, оскільки дає довірчий інтервал ознака вірогідної фактичної точності (ймовірний інтервал буде краще). Тоді, по суті, йдеться про те, щоб зробити таблицю акуратною, стислою та читаною, тому, по суті, навряд чи існує просте правило, яке підходить на всі випадки життя.

Повторність важлива в наукових дослідженнях, тому в ідеалі слід мати можливість відтворювати результати на будь-якій кількості значущих фігур (чи мають вони практичне значення чи ні). Округлення до невеликої кількості значущих цифр може знизити довіру до тиражування дослідження, оскільки помилки можуть бути замасковані округленням результатів, тому можливий зворотний бік округлення за деяких обставин.

Ще одна причина, щоб не крутити занадто далеко, це те, що це може зробити неможливим для інших продовжити ваше дослідження, не фактично повторюючи його. Наприклад, я можу опублікувати документ, в якому порівнюються різні алгоритми машинного навчання за допомогою тесту Фрідмана, який залежить від ранжирування різних алгоритмів у наборі наборів даних орієнтирів. Якщо статистичні дані для окремих класифікаторів на кожному наборі даних присвоюються ряду значущих цифр залежно від їх стандартних помилок, це, безсумнівно, створить багато очевидних зв'язків у рейтингу. Це означає, що (i) читач / рецензент статті не зможе повторити тест Фрідмана з результатів, наведених у роботі, та (ii) хтось інший тоді не зможе оцінити свій алгоритм на наборі даних еталону та використовувати Friedman тест, щоб поставити його в контекст результатів мого дослідження.


4

Безумовно, будь-яке рішення, прийняте об'єктивно чи суб'єктивно, сильно залежатиме від того, що ви вимірюєте, і наскільки точним є ваш вимірювальний прилад. Останнє є лише однією частиною спостережуваної зміни, і не завжди легко розпізнати чи знайти існуючі докази. Таким чином, я переконливо підозрюю, що немає об'єктивного загальноприйнятого рішення. Вам просто потрібно використовувати свій мозок і приймати найкраще рішення у кожній ситуації.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.