Для чого використовується стандартна помилка?


9

Я використовую знайдений нами підручник і будую середні значення разом зі стандартними помилками, щоб показати свої дані. Але у мене виникають проблеми з обговоренням результатів. Мій сюжет, як показано нижче: деякі стандартні помилки (показані у вигляді рядка помилок) сильно різняться, а деякі з них дуже близькі до нуля.

введіть тут опис зображення


2
Побічна проблема тут полягає в тому, що використання брусків може виявитись заплутаним. Тривіально, низхідні бруски - трохи складніше роботи, ніж висхідні бруски. Більш принципово, бруски, що починаються з 1e-3, довільні. Більш позитивно, показ оцінок точок за символами точок та додавання рядків помилок було б набагато простішим, ніж показ барів плюс смуги помилок. Google "динамітний сюжет" для більше.
Нік Кокс

Я не впевнений, в чому питання. Виходячи з відповіді, яку ви вказали правильною та назви, можливо, просто знати, що таке стандартна помилка. Але виходячи з того, що у вас є, вам здається, вам потрібна допомога з описом даних. Не могли б ви уточнити у запитанні? Крім того, якщо ви хочете допомогти з описом даних, то, будь ласка, розповідайте більше про дані, а не лише про цифру. N у кожній групі та те, що означають значення, були б корисними. Будь-які трансформації також будуть корисними.
Джон

Відповіді:


10

Загалом смуги помилок - переконати читача сюжету, що відмінності, які він / він бачить на сюжеті, є статистично значущими. У наближенні ви можете уявити собі маленького діапазон якого показаний як ця смужка помилок - "візуальна інтеграція" продукту двох таких гауссов є більш-менш шансом, що ці два значення дійсно рівні.±1σ

У цьому конкретному випадку видно, що і різниця між червоним і фіолетовим смугою, а також сірим і зеленим не надто істотна.


як щодо стандартної помилки в цьому випадку? як намічені смуги помилок.
Беркай

Це погана смуга помилок, якщо це є метою. Неперекривання барів недостатньо для статистичної значущості, а кількість неперекриття, необхідна для того, щоб бути суттєво різною на рівні 0,05, змінюється в залежності від N. І що, чорт, означає "не надто суттєво"? Обидва ці граничні умови, які ви вказали, не зможуть пройти тест.
Джон

@John Як я писав, смужки помилок - це візуальна підказка, яка допомагає робити спеціальні оцінки під час дослідження сюжету; фактичне тестування потребує перевірки певної гіпотези, тому, очевидно, має відбуватися в тексті.

11

Загалом, стандартна помилка говорить про те, наскільки ви непевні, що справжня цінність у верхній частині смужки - там, де вона відповідає. Коли є кілька барів, це також може давати порівняння між барами, в сенсі статистичного тесту. Однак інтерпретувати їх таким чином потрібно деякі припущення, наведені графічно нижче. Якщо ви дійсно зацікавлені в порівнянні барів, щоб побачити, чи є відмінності статистично значущими, тоді слід запустити тести на даних і показати, які тести були значущими, як цей.

порівняння значущості

Крім того, я б запропонував використовувати довірчі інтервали, а не стандартні помилки.

Цей документ варто прочитати:

Куммінг і Фінч. "Висновок очей: Інтервали довіри та способи читання зображень із даних". Am Psych. Вип. 60, № 2, 170–180.

Їх загальний висновок такий: "Шукайте бруски, які безпосередньо стосуються ефектів, що цікавлять, будьте чутливі до експериментальної конструкції та інтерпретуйте інтервали".

Для незалежних вибірок, використовуючи довірчі інтервали, половина накладання CI означає, що різниця є статистично значущою.

невирішені бруски

Для незалежних зразків, що використовують замість них стандартні рядки помилок, наступний графік показує, як визначити статистичну значимість:

індеп барів, SE


Це насправді не відповідь (поки). Ви б не хотіли б доповнити це цитування з деякою інформацією про те, як це допомагає відповісти на питання ОП? (btw, я не є прихильником)
gung - Відновіть Моніку

1
@gung Реальне життя втрутилося, тому я опублікував часткову відповідь. Оновлено.
Арі Б. Фрідман

6

Як говорить mbq, смужки помилок - це спосіб дати вашим читачам відчути, чи є відмінності між двома групами істотними - тобто, якщо різниця в кожній з ваших груп є достатньо малою, щоб вважати, що різниця, яку ви знайшли в середньому між вашими групами.

Якщо всі інші рівні, більші смуги помилок означають більше різниці в межах групи, але схоже, що вісь y вашого ділянки перетворена в журнал, тому нижчі групи не зовсім на тій же шкалі, що і вищі.

Ви повинні знати, багато ваших читачів не зрозуміють, що являють собою смужки помилок, навіть якщо ви прямо поясните це! Часто ви можете досягти однієї і тієї самої мети за допомогою ворсистого крапкового сюжету або боксерської планки (або обох разом), щоб досягти однакового ефекту.


щодо статті, яку ви згадали, це цікаве спостереження, однак це не стає для мене несподіванкою. Я вважаю значну частину статистичних понять і загальних практик заплутаними і суперечливими (хоча я маю сильний досвід математики і пройшов ряд курсів математичної статистики). Особисто я вважаю, що багато понять було б набагато простіше зрозуміти, якби їх навчали візуально та використовували приклади, а не довгі і складні словесні пояснення.
posdef

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.