За допомогою Excel, з урахуванням згрупованих даних, як оцінювати квартилі?


0

Припустимо, у мене є такі згруповані дані для маси собак:

Mass         Frequency

0 to 5          13

6 to 10         28

11 to 15        47

16 to 20        21

21 to 25        11

25 to 30         6

Як я можу використовувати Excel для оцінки першого квартиля?

Я знаю, як зробити ogive (використовуючи діаграму розсіювання з точками, з'єднаними плавною кривою), і я можу використовувати ogive і мої очі (і, можливо, лінійку, розміщену на екрані), щоб приблизно знайти перший квартиль. Але чи може Excel дати мені більш сувору відповідь?

Я не хочу використовувати функцію "Додати трендову лінію", тому що лінія тренду насправді не є очевидним (лінія тренду не проходить через всі точки).

Відповіді:


0

Це згруповані дані, тому, якщо у вас є вихідні дані, вам доведеться щось зробити, щоб відтворити зміни в даних. Для простоти ми можемо припустити, що плоский розподіл - собаки мають рівну ймовірність 0 як 5.

Використовувати REPT() функція для виведення списку чисел, розділених комами, що представляють кожну групу.

=REPT(B2&",",C2)  --- where B2 is your group upper bound and C2 is the group frequency

Use REPT

У нижній частині об'єднайте кожну з цих рядків у один великий рядок:

Long string

Скопіюйте цей рядок і Вставити спеціальний як Значення у новому аркуші. Використовувати Текст до стовпців інструмент на Дані вкладки стрічки для розділення даних на один стовпець на значення. Скопіюйте весь цей діапазон Вставити спеціальний і Перенести щоб перевернути це у вертикальний список значень. Ваші дані повинні виглядати приблизно так:

transposed data

Не соромтеся відкинути горизонтальний рядок - нам це не потрібно. Тепер ми хочемо інтерполювати деякі значення в стовпці B, використовуючи формулу:

=(5*COUNTIF($A$4:A5,A5)/COUNTIF($A$4:$A$5000,A5))+(A5-5)

Порушуючи це, ми маємо:

    =(5*                         -- your groups are increments of 5
       COUNTIF($A$4:A5,A5)       -- how far down a row is within a group
       /                         
       COUNTIF($A$4:$A$5000,A5)  -- what the frequency is for that group
      )                          
      +(A5-5)                    -- add this result to the lower bound

Тепер ви можете використовувати QUARTILE() функція в цьому списку оцінених значень для наближення ваших квартил:

=QUARTILE($B$5:$B$130,1)

enter image description here


0

Графічно ви хочете зробити гістограма з "бункерами" встановлюються на квартили. Ви можете подивитися, як це зробити.

Крім того, можна використовувати формулу. Я опишу це словами, і ви можете зрозуміти математику.

Всього 126 собак. 25% - 31,5. Ви хочете знайти вагу, що 31,5 легких собак важать менше.

У вашому найлегшому контейнері є 13 собак, тому вони підраховуються. Це залишає 18,5 собак, але наступний бункер має 28 собак. Отже, питання: яка вага 18.5 найсвітлішої собаки у другому бункері?

Використовуючи те, що називається лінійною інтерполяцією, можна оцінити, що невідома вага становить 18,5 / 28 від 6 до 10 фунтів. Це 6 + 4 * (18.5 / 28).

Ви можете використовувати той самий підхід, щоб знайти інші квартили, якщо це необхідно.

Мова тут трохи незручна, але ви отримаєте ідею. Я сподіваюся, що це допоможе.

EDIT: Якщо ви знаєте ваги всіх індивідуальних собак, просто ранжуйте їх по порядку і обчислите середню вагу 31-ї і 32-ї собак.


PS. Я отримую 8,64 фунта, використовуючи цей підхід.
Bandersnatch
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.