Для чого використовується стандартна помилка?

9

Я використовую знайдений нами підручник і будую середні значення разом зі стандартними помилками, щоб показати свої дані. Але у мене виникають проблеми з обговоренням результатів. Мій сюжет, як показано нижче: деякі стандартні помилки (показані у вигляді рядка помилок) сильно різняться, а деякі з них дуже близькі до нуля.

введіть тут опис зображення

data-visualization standard-error

— беркай
джерело

2

Побічна проблема тут полягає в тому, що використання брусків може виявитись заплутаним. Тривіально, низхідні бруски - трохи складніше роботи, ніж висхідні бруски. Більш принципово, бруски, що починаються з 1e-3, довільні. Більш позитивно, показ оцінок точок за символами точок та додавання рядків помилок було б набагато простішим, ніж показ барів плюс смуги помилок. Google "динамітний сюжет" для більше.

— Нік Кокс

Я не впевнений, в чому питання. Виходячи з відповіді, яку ви вказали правильною та назви, можливо, просто знати, що таке стандартна помилка. Але виходячи з того, що у вас є, вам здається, вам потрібна допомога з описом даних. Не могли б ви уточнити у запитанні? Крім того, якщо ви хочете допомогти з описом даних, то, будь ласка, розповідайте більше про дані, а не лише про цифру. N у кожній групі та те, що означають значення, були б корисними. Будь-які трансформації також будуть корисними.

— Джон

10

Загалом смуги помилок - переконати читача сюжету, що відмінності, які він / він бачить на сюжеті, є статистично значущими. У наближенні ви можете уявити собі маленького діапазон якого показаний як ця смужка помилок - "візуальна інтеграція" продукту двох таких гауссов є більш-менш шансом, що ці два значення дійсно рівні. $\pm1\sigma$

У цьому конкретному випадку видно, що і різниця між червоним і фіолетовим смугою, а також сірим і зеленим не надто істотна.

як щодо стандартної помилки в цьому випадку? як намічені смуги помилок.

— Беркай

Це погана смуга помилок, якщо це є метою. Неперекривання барів недостатньо для статистичної значущості, а кількість неперекриття, необхідна для того, щоб бути суттєво різною на рівні 0,05, змінюється в залежності від N. І що, чорт, означає "не надто суттєво"? Обидва ці граничні умови, які ви вказали, не зможуть пройти тест.

— Джон

@John Як я писав, смужки помилок - це візуальна підказка, яка допомагає робити спеціальні оцінки під час дослідження сюжету; фактичне тестування потребує перевірки певної гіпотези, тому, очевидно, має відбуватися в тексті.

11

Загалом, стандартна помилка говорить про те, наскільки ви непевні, що справжня цінність у верхній частині смужки - там, де вона відповідає. Коли є кілька барів, це також може давати порівняння між барами, в сенсі статистичного тесту. Однак інтерпретувати їх таким чином потрібно деякі припущення, наведені графічно нижче. Якщо ви дійсно зацікавлені в порівнянні барів, щоб побачити, чи є відмінності статистично значущими, тоді слід запустити тести на даних і показати, які тести були значущими, як цей.

порівняння значущості

Крім того, я б запропонував використовувати довірчі інтервали, а не стандартні помилки.

Цей документ варто прочитати:

Куммінг і Фінч. "Висновок очей: Інтервали довіри та способи читання зображень із даних". Am Psych. Вип. 60, № 2, 170–180.

Їх загальний висновок такий: "Шукайте бруски, які безпосередньо стосуються ефектів, що цікавлять, будьте чутливі до експериментальної конструкції та інтерпретуйте інтервали".

Для незалежних вибірок, використовуючи довірчі інтервали, половина накладання CI означає, що різниця є статистично значущою.

невирішені бруски

Для незалежних зразків, що використовують замість них стандартні рядки помилок, наступний графік показує, як визначити статистичну значимість:

індеп барів, SE

— Арі Б. Фрідман
джерело

Це насправді не відповідь (поки). Ви б не хотіли б доповнити це цитування з деякою інформацією про те, як це допомагає відповісти на питання ОП? (btw, я не є прихильником)

— gung - Відновіть Моніку

1

@gung Реальне життя втрутилося, тому я опублікував часткову відповідь. Оновлено.

— Арі Б. Фрідман

6

Як говорить mbq, смужки помилок - це спосіб дати вашим читачам відчути, чи є відмінності між двома групами істотними - тобто, якщо різниця в кожній з ваших груп є достатньо малою, щоб вважати, що різниця, яку ви знайшли в середньому між вашими групами.

Якщо всі інші рівні, більші смуги помилок означають більше різниці в межах групи, але схоже, що вісь y вашого ділянки перетворена в журнал, тому нижчі групи не зовсім на тій же шкалі, що і вищі.

Ви повинні знати, багато ваших читачів не зрозуміють, що являють собою смужки помилок, навіть якщо ви прямо поясните це! Часто ви можете досягти однієї і тієї самої мети за допомогою ворсистого крапкового сюжету або боксерської планки (або обох разом), щоб досягти однакового ефекту.

— Девід ш
джерело

щодо статті, яку ви згадали, це цікаве спостереження, однак це не стає для мене несподіванкою. Я вважаю значну частину статистичних понять і загальних практик заплутаними і суперечливими (хоча я маю сильний досвід математики і пройшов ряд курсів математичної статистики). Особисто я вважаю, що багато понять було б набагато простіше зрозуміти, якби їх навчали візуально та використовували приклади, а не довгі і складні словесні пояснення.

— posdef

2

У багатьох дослідників виникають проблеми з інтерпретацією цих графіків. Дивіться http://scienceblogs.com/cognitivedaily/2008/07/31/most-researchers-dont-understa-1/ для більш детальної розробки.

— xmjx
джерело