Кількість значущих цифр, які слід помістити в таблицю?


13

Чи існує обґрунтоване правило щодо кількості важливих цифр для публікації?

Ось кілька конкретних прикладів / питань:

  • Чи є спосіб співвідносити кількість значущих цифр з коефіцієнтом варіації? Наприклад, якщо оцінка становить 12,3, а резюме - 50%, чи означає це, що інформація, представлена ​​".3", наближається до нуля?

  • Якщо довірчий інтервал має діапазон порядків, чи повинні вони мати однакову кількість значущих цифр, наприклад:

    12,3 (1,2, 123,4) проти 12 (1,2, 120)

  • Чи повинна кількість значущих цифр в оцінці помилки бути однаковою чи меншою, ніж середня кількість значущих цифр?


Якщо ви можете, не використовуйте таблицю :) Графіка, IMO, майже завжди легше читати, ніж таблиця (він очевидним винятком є, якщо у вас немає численних чисел). Журнали та їх рецензенти не завжди згодні, на жаль ....
JMS

3
@JMS Добре, але Таблиці корисні для узагальнення детальних характеристик статистичних одиниць (перекреслених за факторним інтересом, наприклад, клінічним діагнозом чи будь-яким іншим), змінних різних типів (безперервного, номінального та порядкового) та інших результатів від статистичного моделювання як такого (матриця плутанини, регресійний коефіцієнт тощо), яке не вписується в цифри (або не завжди, якщо ви думаєте про підхід Гельмана для відображення рег. кофе як точкових діаграм). Нам потрібно обоє; питання в тому, коли нам насправді потрібна Фігура замість таблиці, ІМО.
chl

@chi Fair. Я це говорив майже завжди :). Такі речі, як великі n-шлях таблиці, неможливо (повністю) відтворити графічно. Це залежить від форуму, який я б сказав. Таблиці мають перевагу бути повноцінними, впевнено, але чи читач насправді поглинає всю ту зайву інформацію? Якщо у графіку занадто багато параметрів, я можу стверджувати, що таблицю часто принаймні важко читати. Однак я вважаю, що повні результати повинні бути доступними (в Інтернеті, додатку тощо), якщо не тільки відтворюваність. У цьому випадку я хотів би також дані та код! Блукав ОТ, вибач ..
JMS

Крім того, я думаю, що коефіцієнти регресії та матовості плутанини (кореляція, коваріантність, ...) зазвичай краще підходять для графічного відображення, крапкових таблиць або подібних для перших та теплових карт або графіків для останніх.
JMS

@JMS Я погоджуюся з вашою думкою, але в цьому випадку існує обмеження цифри, в деяких інших випадках - цифри. Крім того, у цьому випадку, якщо читачі переглянуть таблицю і зосереджуються на представлених фігурах, то вони не витратять часу на спроби з'ясувати точку езотеричної фігури. Але я повністю підтримую відтворюваність, і, хоча я перебуваю на цьому, я міг би (якщо обійдусь до нього) додати візуалізацію таблиці до доданого коду.
David LeBauer

Відповіді:


19

Я сумніваюся, що існує універсальне правило, тому я не збираюсь вигадувати. Я можу поділитися цими думками та причинами, що стоять за ними:

  • Коли резюме відображають самі дані - макс., Хв., Статистику замовлень тощо. - використовуйте однакову кількість значущих цифр, що використовуються для запису даних. Це забезпечує послідовне представлення у всьому документі щодо точності даних.

  • nn3n3030<n300

    -Зауважте, що резюме не дає корисної інформації з цього приводу.

    -Деякі оцінки можна отримати з великою точністю. Їх не потрібно округляти, щоб відповідати чомусь іншому. Наприклад, середнє значення 1000 000 цілих чисел може становити 10,977 при стандартній помилці 0,00301. Моє рішення записати середнє значення до трьох знаків після коми (і 4-5 знаків) було засноване на порядку величини SE, який вказує, що остання цифра є частково достовірною. Рішення записати SE на три знакові фігури (п’ять знаків після коми) є більш довільним: дві сиг-фіги будуть працювати; одного, мабуть, не хотів би; чотири сиг-інжири також працюватимуть і відповідатимуть 4-5 сиг-фіг у середньому; більше чотирьох сиг-фігів буде надмірним. (Можна було б оцінити стандартну похибку самої SE з точки зору четвертого моменту даних і використовувати це для визначення відповідної кількості округлення, але більшість з нас не виникає таких проблем ...)

  • Сигналізуйте читача, коли ви робите суттєве округлення . Будьте особливо обережні, коли у звіті обговорюється сам статистичний тест . Причина полягає в тому, що люди можуть використовувати вашу роботу для перевірки власних розрахунків. Іноді навіть незначна різниця може виявити помилку. Ви не хочете створювати неприємностей, оскільки ви округлили 123 до 120, а хтось інший, перевіряючи роботу, отримує 123 і підозрює, що хтось із вас помилився.

  • Будьте послідовними . Ви можете втратити деяких читачів, якщо в одному пункті ви перерахуєте значення як 123, а пізніше позначите його як 120.

  • Не будь смішним . (Я автоматично підозрюю некомпетентність, коли зустрічаю звіти, які дають статистичні результати до 15 сиг-фіг, коли в даних є, наприклад, лише дві сиг-фіг.)


2
Мій дуже великий +1, оскільки це дійсно багато хороших порад. Я також хочу показати студентам, що насправді безглуздо підсумовувати дані, отримані в ході опитувань (або голосів), як% із великою кількістю десяткових знаків, не враховуючи розмір вибірки (що впливає на стандартну помилку).
chl

0

Я б запропонував 12 (1.2, 123.4). Пропустіть .3, оскільки це майже безглуздо, але багато людей, коли бачать (1,2, 120), припускають, що останній "0" у 120 є значущим.


Чому ви пропонуєте опустити десятковий знак для статистики, що цікавить, якщо ви погоджуєтесь показувати їх у КІ (тобто, якщо це безглуздо для 12, чому це має сенс для 123.4)?
chl

@chl: це не має великого сенсу, але пропустити це може ввести в оману. Якщо я вставлю 123.4, хтось, як ви, побачить зайві цифри і просто знехтує їх, не заподіявши шкоди. Якщо я поставлю в 120, багато читачів подумають, що це точно до трьох цифр - погано.
AVB

досі незрозуміло, чому ви рекомендуєте 123.4 замість 123 (чому пропустіть .3, але ні .4 у прикладі?)
Девід ЛеБоер,
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.