Використовуючи середню довжину та середню вагу для обчислення середнього ІМТ?


13

Чи справедливо використовувати середню довжину ( ) та середню вагу ( )) від даної сукупності для обчислення середнього показника ( ) для цієї популяції?hwBMI=wh2


Питання не в тому, що абстрактно (за коментарем @ JoeTaxpayer): типові ІМТ реального світу (15.0-30.0) вже збираються округлити до 1dp, тож якщо помилка в середньому ІМТ через використання коефіцієнта засобів становить ~ 0,05 -0.1 це математично незначно (<1%); для більшості розподілів у реальному світі (зріст, вага). Ми не говоримо про
Лореля

Відповіді:


18

Математично це не так, що вони обов'язково близькі. Це спрацювало б, якби це було так, що але це взагалі помилково, і в деяких конкретних ситуаціях це може бути досить далеко.E(Y/X2)=E(Y)/E(X)2

Однак для досить реалістичного набору даних про висоту і вагу двовимірного виглядає, що вплив буде невеликим.

Наприклад, розглянемо модель для росту та ваги дорослих чоловіків у США в Брайнарді та Бурмастері (1992) [1]; Ця модель є двовимірною нормою по висоті та зрубу (вазі), що досить добре відповідає розмірам даних про висоту та полегшує реалістичне моделювання. Гарна модель для жінок є трохи складнішою, але я не сподіваюся, що це змінить якість наближення до ІМТ; Я просто збираюся робити самців, тому що дуже проста модель досить гарна.

Перетворивши модель там для чоловічого зросту та ваги на метричну та імітуючи 100000 біваріантних точок у R перед розрахунком окремих ІМТ, а значить, середнього ІМТ, а також обчислення середньої висоти на (середній вазі) -квадраті, виходить результат, що середній ІМТ було (до чотирьох цифр) 25,21, а було 25,22, що виглядає досить близько.h¯/w¯2

З огляду на ефект зміни параметрів, схоже, вплив використання упередженого оцінювача змінних засобів для жінок, ймовірно, буде дещо більшим, але все ще недостатньо істотним, що це може бути великою проблемою.

В ідеалі слід перевірити щось ближче до будь-якої ситуації, для якої ви хочете використовувати його, але це, мабуть, буде досить добре.

Отже, для типової ситуації, здається, навряд чи це буде великою проблемою на практиці.

[1]: Brainard, J. and Burmaster, DE (1992),
"Двовимірні розподіли для зросту та ваги чоловіків і жінок у США",
Аналіз ризиків , Vol. 12, № 2, стор 267-275


10

Це не зовсім правильно, але зазвичай це не призведе до величезних змін.

Наприклад, припустимо, що ваше населення має ваги 80, 90 і 100 кг, а він становить 1,7, 1,8 і 1,9 м у висоту. Тоді ІМТ - 27,68, 27,78 і 27,70. Середнє значення ІМТ становить 27,72. Якщо ви обчислите ІМТ за допомогою ваг і висот, ви отримаєте 27,78, що трохи відрізняється, але зазвичай не повинно робити все так багато.


Дякую купу за вашу відповідь! Отже, це означає, що цей метод обчислення, ймовірно, не підходить для будь-якого типу статистичного аналізу, правда?
Софі Мішель

2
Чесно кажучи, я б не пішов так далеко. У будь-якому випадку статистика має справу з галасливими даними, і незначна неточність у вимірюванні висоти чи ваги може карликувати різницю, яку ми маємо тут. Я рекомендую вам моделювати щось за цими напрямками з даними, які ви думаєте про використання, а потім подумати, чи справді ці крихітні відмінності матимуть вплив на ваш статистичний аналіз.
Стефан Коласа

1
"Якщо ви обчислите ІМТ із засобів ваг і висот, ви отримаєте 27,78" Але це рівне максимуму ІМТ! Отримати максимум замість середнього здається мені великою різницею.
Накопичення

@ Накопичення - Точка Стефана померла, але вибір чисел не добре ілюстрував ситуацію. ІМТ для "нормальних" становить 18,5 - 24,9. 3 ІМТ у прикладі мають низький до високого діапазону .1. Різниця на 1/2% за цими даними - це шум. ІМТ чоловіка на 5'8 "зростає з 27,4 до 27,5, коли його вага зростає з 180 до 181. 1 фунт - це різниця між випиванням високої склянки води до або після того, як потрапити на шкалу.
JTP - Вибачте Моніку

@JoeTaxpayer: Я думаю, Ваша думка полягає в тому, що типові ІМТ (15,0-30,0) вже збираються округлити до 1dp, тож якщо похибка середнього ІМТ через використання коефіцієнта значень <0,05, це математично незначно. Правильно?
smci

3

Хоча я погоджуюся з іншими відповідями, що цілком ймовірно, що цей метод наблизить середнє значення ІМТ, я хотів би зазначити, що це лише наближення.

Я насправді схильний сказати, що ви не повинні використовувати описаний вами метод, оскільки він просто менш точний. Нераціонально обчислювати ІМТ для кожної людини, а потім приймати середнє значення, даючи реальну середню ІМТ.

Ось я проілюстрував дві крайності, коли засоби ваги та довжини залишаються однаковими, але середній ІМТ насправді різний:

Використовуючи наступний (матлаб) код:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');

Ми отримуємо: mean_bmi2

Якщо ми просто переоформляємо довжини, ми отримуємо інше середнє ІМТ, тоді як середнє (вага) / середнє (довжина ^ 2) залишається таким же:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same

середній bmi

Знову ж таки, використовуючи реальні дані, ймовірно, ваш метод наблизить до реального середнього ІМТ, але чому б ви використовували менш точний метод?

Поза межами питання: Завжди корисно візуалізувати свої дані, щоб ви могли фактично бачити розподіли. Якщо ви помітили, наприклад, певні кластери, ви також можете розглянути можливість отримання окремих засобів для цих кластерів (наприклад, окремо для перших трьох та останніх 3 людей у ​​моєму прикладі)


2
"Тривіально обчислити показник ІМТ для кожної людини, а потім прийняти середнє значення, даючи вам реальну середню ІМТ." Так, якщо у вас є необроблені дані. Якщо все, що у вас є, - це підсумкова статистика для населення, наприклад середній зріст і вага, то вивести "ІМТ населення" з них найкраще, що ви можете зробити, і питання про те, наскільки погане наближення є цілком справедливим.
Стефан Коласа

1
+1 Не збирайте агрегати, якщо ви зможете отримати однаковий варіант відповіді, що збирає необроблені дані. Є відповіді та зауваження, що в цьому випадку це мало / не / тонко / мізерно, але не робіть цього. Вивчайте та використовуйте здорові практики щодо аналізу даних, робіть це правильно.
Stian Yttervik
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.