Контрприклади, коли медіана знаходиться поза [Середній режим]


11

Ця стаття вище моєї ліги, але вона говорить про тему, яка мене цікавить, взаємозв'язок між середнім, режимом та медіаною. Він говорить :

Поширена думка, що медіана унімодального розподілу "зазвичай" між середнім і модним. Однак це не завжди так ...

Моє запитання : чи може хтось навести приклади безперервних одномодальних (ідеально простих) розподілів, коли медіана знаходиться поза інтервалом [режим, середній]? Наприклад, такий розподіл, як mode < mean < median.

=== EDIT =======

Глен_б і Френсіс вже мають хороші відповіді, але я зрозумів, що те, що мене справді цікавить, - це приклад, коли режим <середній <середній або середній <середній <режим (тобто обидва медіана знаходиться поза [режим, означає] І медіана є "з тієї ж сторони", що і середнє значення режиму (тобто режим вгорі або внизу)). Я можу прийняти відповіді, це відкрите нове запитання чи, можливо, хтось може прямо запропонувати рішення тут?


Розширити відповідь на більш обмежений випадок не складе труднощів.
Glen_b -Встановіть Моніку

2
Ознайомтеся з рисунком 6 тут: ww2.amstat.org/publications/jse/v13n2/vonhippel.html, який дає приклад (безперервний одномодальний) приклад Вейбула, коли медіана не знаходиться між режимом і середнім значенням.
Меттью Тауерс

Відповіді:


14

Звичайно, не важко знайти приклади - навіть безперервні одномодальні - там, де медіана не знаходиться між середнім та режимом.

  1. Розглянемо від трикутного розподілу формиf T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2fT(t)=2(1t)10<t<1

    Тепер нехай - це 60-40 суміш і .T 1 - 4 T 2XT14T2

    Щільність виглядає приблизно так:X

    Суміш двох трикутних густин з медіаною поза інтервалом середнього режиму

    Середнє значення нижче 0, режим - 0, але медіана вище 0. Незначна модифікація цього дає приклад, коли навіть щільність (а не просто cdf) була безперервною, але взаємозв'язок між мірками розташування був те саме (редагувати: див. 3. нижче).

  2. Узагальнюючи, покладемо пропорцію (з ) від загальної ймовірності в правий трикутник і пропорцію у лівий бічний трикутник (замість 0,6 і 0,4 у нас були раніше). Далі зробіть коефіцієнт масштабування на лівій половині а не (з ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p0<p<1(1p)β4β>0

    щільність для узагальненого варіанту цієї суміші двох трикутних густин

    Якщо припустити , медіана завжди буде знаходитись в інтервалі, охопленому правим трикутником, тому медіана перевищить режим (який завжди залишатиметься на рівні ). Зокрема, коли , медіана буде дорівнює . 0p>1p>120 1-1/p>1211/2p

    Середнє значення буде при .(pβ(1p))/3

    Якщо то середнє значення буде нижче режиму, а якщо середнє буде вище режиму.β>p/(1p)β<p/(1p)

    З іншого боку, ми хочемо зберегти середнє значення нижче медіани.(pβ(1p))/3<11/2p

    Розглянемо ; це ставить медіану вище режиму.p=0.7

    Тоді задовольняє тому середнє значення вище режиму.β=2β<p/(1p)

    Медіана насправді становить тоді як середнє значення дорівнює . Отже для і маємо режим <середній <середній.11/1.40.15480.72(0.3)30.0333p=0.7β=2

    (Примітка. Для узгодження моєї позначення змінна на осі x для обох ділянок повинна бути а не але я не збираюся повертатися назад і виправляти її.)xt

  3. Це приклад, коли сама щільність є безперервною. Він заснований на підході в 1. і 2. вище, але з "стрибком" замінено на крутий схил (і тоді вся щільність перекинулася приблизно на 0, тому що я хочу приклад, який виглядає прямо нахилом).

    неперервна, кусочно-лінійна щільність із середнім <середнім <режимом

    [Використовуючи підхід "суміш трикутних густин", його можна генерувати у вигляді суміші 3 незалежних масштабованих змінних трикутної форми, описаних у розділі 1. Зараз у нас 15% , 60% та 25% .]T13T25T3

    Як ми бачимо на діаграмі вище, середня сторона знаходиться в середині, як вимагається.


  1. Зауважте, що m_t_ в коментарях згадує Weibull (для якої медіана знаходиться поза інтервалу для невеликого діапазону параметра ). Це потенційно задовольняє, оскільки це відомий одномодальний безперервний (і плавний) розподіл з простою функціональною формою.[mode,mean]k

    Зокрема, для малих значень параметру форми Вейбулла розподіл є прямим перекосом, і у нас є звичайна ситуація медіани між режимом та середнім значенням, тоді як для великих значень параметра форми Вейбулла розподіл є лівим нахилом , і ми знову маємо ту «медіану посередині» (але тепер із режимом праворуч, а не середнім). Між цими випадками є невелика область, де медіана знаходиться поза інтервалом середнього режиму, і в середині цього середнє і модове перетинаються:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    Вибираючи зручні значення для параметра фігури в інтервалах, позначених (1) та (2) вище - тих, де зазори між статистикою розташування приблизно рівні - отримуємо:

    Щільність Вейбула з медіаною поза середньоквадратичним інтервалом

    Хоча вони відповідають цим вимогам, на жаль, три параметри розташування настільки близькі між собою, що ми не можемо візуально їх розрізнити (всі вони потрапляють у один і той же піксель), що трохи невтішно - випадків для моїх попередніх прикладів набагато більше відокремлений. (Тим не менш, він пропонує ситуації, які слід вивчити з іншими розподілами, деякі з яких можуть дати результати, які більш візуально відрізняються.)


Це працює, дякую. З цікавості, який би був подібний "трикутний розподіл", коли режим <середній <середній? (тут медіана <режим <середній)
Джантельме

Насправді в моєму оригінальному прикладі означає <режим <середній; у вас були нерівності назад. Зараз я додав подібний приклад, коли середнє значення перевищує режим, але нижче медіани (дійсно, ви могли просто замінити початковий на скажімо і зберегли пропорції суміші для правої частини та для ліва частина). 4T21.25T20.60.4
Glen_b -Встановіть Моніку

6

Наступний приклад взято з контрприкладів ймовірності Джордана Стоянова .

Враховуючи позитивну константу і , розглянемо випадкову змінну з щільністю Середнє значення , медіана та режим of можна знайти як Примітка є щільністю, лише якщо Отже, якщо дозволити то . В результаті, якщо ми виберемо , близький доcλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMXf ( x ) c 2
μ=c33+c2λ+cλ2,m=1,M=c.
f(x)c1λ2c>111.0001μ>cM=cmμM
c22+cλ=1.
c1λ2c>11 (скажімо ), ми можемо виявити , що і , так що медіана не падає між і .1.0001μ>cM=cmμM

0

Візьмемо експоненціальний розподіл з параметром швидкості a та щільністю exp (-ax) при 0 <= x <нескінченності. Режим знаходиться на нулі. Звичайно, середня та медіанна більше 0. Cdf дорівнює 1-exp (-ax). Тож для медіани розв’язання для exp (-ax) = 0,5 для x. Тоді -ax = ln (0,5) або x = -ln (0,5) / a. Для середнього інтегруємо ax exp (-ax) від 0 до нескінченності. Візьмемо a = 1 і маємо медіану = -ln (0,5) = ln (2) і середнє = 1.

Отже режим <середній <середній.


1
Вибачте, але чи ми не шукаємо дистрибутивів, де режим <середній <середній (або загалом там, де медіана поза [режим, середній])?
Janthelme

3
Вибачте за плутанину, я додав до початкового запитання, але те, що я запитував спочатку, - це приклади, коли медіана знаходиться поза [режим, означає], хоча я думаю, що у вашому прикладі медіана знаходиться в режимі [режим, медіана].
Janthelme

3
Майкл, питання не задає випадок, коли медіана знаходиться між режимом і середнім. Ви неправильно цитуєте оригінал у своєму коментарі трохи вище цього; питання не говорить про "режим <середній <середній", де ви заявляєте, що це робиться (і ніколи цього не робив у будь-який момент історії редагування). Як результат, у Вашій відповіді подається справа, про яку не вимагається; Дійсно, це звичайна ситуація (медіана посеред двох інших), з якої питання шукає винятку. Практично будь-який відомий перекошений унімодальний розподіл має середню серединку - фокус у пошуку тих, хто цього не робить.
Glen_b -Встановіть Моніку

1
Історія редагування доступна, натиснувши на червоне посилання внизу питання, де в даний час написано "відредаговано 18 годин тому" (вона змінилася на 19, коли я вводив ці коментарі). Ви можете переглянути історію редагувань, натиснувши там. Питання було розміщено 22 години тому (як я це зараз вводя), і коли ви натискаєте історію редагування, то внизу, що позначена "1", можна побачити оригінальне запитання. Ваша відповідь з’явилася приблизно через 2 години (20 годин тому), коли саме це питання все-таки говорилося. Приблизно через 1-2 години після вашого допису ОП один раз відредагувало їх питання, яке можна побачити ...
Glen_b -Встановити Моніку

1
ctd ... у верхній частині історії редагування. Після кожного редагування є дві хвилини, щоб внести зміни, які вважаються частиною цього редагування (наприклад, 22 години тому та 18-19 годин тому, було два - щохвилинне вікно кожного разу, де, можливо, було зафіксовано помилку друку), але ~ 20 годин тому, коли ви публікували, питання було незмінним протягом приблизно 2 годин, і воно залишалося незмінним протягом більше години після публікації, коли основна редакція ( показано в історії редагування). Будь-які зміни поза цими короткими двохвилинними вікнами після редагування будуть в історії редагування.
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.