Коли відповідні ваги журналу?


57

Я читав, що використання шкал журналів під час побудови графіків / графіків є доцільним у певних обставинах, наприклад, вісь y у діаграмі часових рядів. Однак мені не вдалося знайти остаточного пояснення, чому це так, або коли це було б доречно. Будь ласка, майте на увазі, що я не статистик, тому я, можливо, зовсім не пропускаю суть, і якщо це так, я буду вдячний за направлення на коригувальні ресурси.


10
Це не формальна відповідь, але - коли змінна охоплює кілька порядків, на очах часто простіше (і більш інформативно) візуалізувати її за шкалою журналу.
Макрос

Макрос - це має сенс (особливо коли у вас є аудиторія, яка може це зрозуміти!)
dav

1
Ви можете знайти цю тісно пов’язану нитку використання, поки ви чекаєте конкретних відповідей: stats.stackexchange.com/questions/298 . З точки зору графіків, ви можете плідно інтерпретувати залежну змінну як "вісь у". Потім погляньте на багато тісно пов'язаних питань, які з’явилися тут.
whuber

3
Також у FYI Naomi Robbins є досить проста стаття на цю тему, яка також повинна цікавити, коли я повинен використовувати логарифмічні ваги у своїх діаграмах та графіках? .
Енді Ш

Whuber, дякую за вказівку на додаткові посилання. Я бачив деякі з них, але не всіх, і зараз я проходжу їх.
дав

Відповіді:


51

Це дуже цікаве запитання, про яке надто мало хто замислюється. Існує кілька різних способів, за якими масштаб журналу може бути відповідним. Перше і найвідоміше - це те, що згадує Макрос у своєму коментарі: масштаби журналів дозволяють відображати великий діапазон без невеликих значень стискати внизу графіка.

Інша причина віддати перевагу масштабуванню журналу - в тих випадках, коли дані є більш природними геометрично. Наприклад, коли дані представляють концентрацію біологічного медіатора. Концентрація не може бути негативною, а мінливість майже незмінно масштабується із середньою величиною (тобто є гетероседастична дисперсія). Використовуючи логарифмічну шкалу або, що, відповідно, використовуючи концентрацію журналу як основну, міра обидва «фіксує» неоднакову мінливість та дає шкалу, яка не обмежена на обох кінцях. Концентрації, ймовірно, нормально розподіляються, і тому масштабування журналу дає нам дуже зручний результат, який, мабуть, "природний". У фармакології ми використовуємо логарифмічну шкалу для концентрації ліків набагато частіше, ніж ні,

Ще одна вагома причина масштабу журналу, ймовірно, те, що вас цікавить для даних часових рядів, пов’язане з можливістю шкали журналу робити дробові зміни рівнозначними. Уявіть собі відображення довгострокових показників своїх пенсійних інвестицій. Він (повинен) зростати приблизно експоненціально, тому що завтрашній інтерес залежить від сьогоднішніх інвестицій (грубо кажучи). Таким чином, навіть якщо ефективність у відсотковому вираженні була досить постійною, графік фондів, як видається, зростає найшвидше у правій частині. За допомогою логарифмічної шкали постійне зміна відсотка розглядається як постійне вертикальне відстань, тому постійний темп зростання розглядається як пряма. Це часто є істотною перевагою.

Ще одна дещо езотеричніша причина вибору шкали журналів виникає в тих випадках, коли значення можна обґрунтовано виражати як x або 1 / x. Прикладом мого власного дослідження є судинний опір, який також може бути виразно виражений як зворотна судинна провідність. (Також в деяких обставинах доцільно думати про діаметр кровоносних судин, який масштабується як сила опору чи провідність.) Жоден із цих заходів не має реальності, ніж інші, і те і інше можна знайти в наукових роботах. Якщо їх масштабувати логарифмічно, то вони є просто негативом одне одного, і вибір того чи іншого не має суттєвої різниці. (Діаметр судин буде відрізнятися від опору та провідності постійним множником, коли всі вони будуть масштабовані.)


Дякую за чудову відповідь! Чи можете ви детальніше розповісти про "значення можна виразити як x"?
ktdrv

4
@ktdrv Деякі речі мають сенс в будь-якому випадку. Скажіть, ви хочете задокументувати вміння рибалки. Ви можете порахувати кількість виловленої риби на день або можете виміряти інтервал між послідовними виловами. Будь-яке вимірювання має сенс, але вони нелінійно пов'язані один з одним. Вони масштабуються взаємно один з одним і тому можуть бути перетворені один на один. Журнал інтервалу і журнал числа в день лінійно пов'язані один з одним і відрізняються постійним (від'ємним) фактором.
Майкл Лев

1
Майкл, дякую за чудову відповідь. Я мушу визнати, що мені було потрібно деякий час, щоб проглянути всі ваші моменти (і довелося переглядати кілька термінів, як-от "гетероседастична дисперсія"). Я все ще чітко розумію, що реально матиме відповідь на мою роботу, але я вдячний за загальний напрямок та деякі вказівки, які вказують мені на цьому шляху.
дав

x1/xlog(x)x1/x x1/xx1/x

pH=log[H+]

29

Деякі приклади реального життя, які я мав надати як доповнення до дуже гарної відповіді @Michael Lew.

По-перше, два сюжети часових рядів показують щомісячні відвідування відвідувачів Нової Зеландії, доступні в статистиці Нової Зеландії . Обидва сюжети мають своє призначення, але я вважаю той, що має вертикальну вісь у логарифмічному масштабі, вражаюче корисний для багатьох інших цілей, ніж перший. Наприклад, ви можете бачити, що сезонність прибутків залишається приблизно пропорційною шкалі прибуття; і ви можете побачити значні зміни в темпах зростання (наприклад, під час другої світової війни), які просто непомітні в початковому масштабі.

введіть тут опис зображення

По-друге, наведені нижче графіки показують загальну кількість поїздок, пов'язаних з поїздками туристів до Нової Зеландії, порівняно з витратами, поки вони фактично перебувають у Новій Зеландії. Джерелом є Міжнародне опитування відвідувачів Міністерства економічного розвитку. Різниця - це витрати перед поїздкою, наприклад оплата заздалегідь оплачені готелі або пакети Перший сюжет, в оригінальній шкалі, може бути використаний для кількох цілей, крім дуже грубого (але важливого) враження про групування даних у лівому нижньому куті. Другий сюжет жертвує деякою негайною інтерпретацією, особливо для нестатистів (через це, як правило, зараз я фактично використовую логарифмічну шкалу на осях, а не перетворюю дані і маю шкалу, що показує логарифмічну цінність), але дає багато більше візуальна диференціація.

Наприклад, ви можете чітко помітити декількох людей, що втратили досвід (які виявилися помилками редагування даних), де загальні витрати були меншими, ніж витрати в Новій Зеландії. Можливо, що ще важливіше, ви можете використовувати цей графік з різними кольорами чи обличчям, щоб показати, як різні країни ринку або цілі відвідування (наприклад, свято проти відвідування друзів та родини) займають різні частини "простору" витрат - те, що було б просто непомітним на оригінальних осях.

Перетворення цього сюжету на щось корисне передбачало б якось попрацювати з даними високої щільності (наприклад, додавши деяку прозорість до точок або замінивши точки на шестикутні кошики, пофарбовані відповідно до щільності), але будь-яке корисне візуальне рішення майже напевно залучатиме логарифмічні осі.

введіть тут опис зображення

редагування / доповнення

Ще один сюжет для ілюстрації того, що я мав на увазі під шестикутними бункерами, використовуючи колір, щоб зобразити щільність, коли є великий набір даних (у цьому випадку близько 12000 респондентів для опитування досвіду Кубка світу з регбі у Новій Зеландії). Зауважте ще раз, це ще один приклад, коли я використовував логарифмічну шкалу для витрат.

введіть тут опис зображення


Петро, ​​дякую за додаткове розуміння - графіка справді допомагає зрозуміти ваші моменти. Одне наступне запитання (якщо ви так схильні), чому б ви замінили очки на "шестикутні" бункери? Це та сама ідея, що і «Сюжет соняшнику»? Я раніше не чув цього терміна.
дав

Ні, не відрізняється від соняшникових ділянок. Сенс полягає в тому, щоб розділити площу графіку на шестикутні бункери, а потім розфарбувати їх (наприклад, від світлого до темного) відповідно до кількості точок у кожній відрізку. Це може бути хорошим способом обійти складання великих наборів даних, які в іншому випадку мають тенденцію просто перетворюватися на чорну масу.
Пітер Елліс

@DavidVandenbos - Я додав приклад
Пітер Елліс

(решта коментаря) @PeterEllis Дякую за уточнення. Це чудовий спосіб візуалізації даних - дуже схожих на географічні теплові карти, якими я користуюся. Ви створили це в R?
дав

Так, R, використовуючи пакет ggplot2 - дуже добре для цієї мети і досить просто, як тільки ви отримаєте основи.
Пітер Елліс

9

Ще одна чудова річ у масштабах журналів - це те, що вони роблять співвідношення симетричними. Наприклад, наприклад: введіть тут опис зображення


9
Було б непогано побачити той самий сюжет у лінійному масштабі, для порівняння
nico
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.