Чи справедливо використовувати середню довжину ( ) та середню вагу ( )) від даної сукупності для обчислення середнього показника ( ) для цієї популяції?
Чи справедливо використовувати середню довжину ( ) та середню вагу ( )) від даної сукупності для обчислення середнього показника ( ) для цієї популяції?
Відповіді:
Математично це не так, що вони обов'язково близькі. Це спрацювало б, якби це було так, що але це взагалі помилково, і в деяких конкретних ситуаціях це може бути досить далеко.
Однак для досить реалістичного набору даних про висоту і вагу двовимірного виглядає, що вплив буде невеликим.
Наприклад, розглянемо модель для росту та ваги дорослих чоловіків у США в Брайнарді та Бурмастері (1992) [1]; Ця модель є двовимірною нормою по висоті та зрубу (вазі), що досить добре відповідає розмірам даних про висоту та полегшує реалістичне моделювання. Гарна модель для жінок є трохи складнішою, але я не сподіваюся, що це змінить якість наближення до ІМТ; Я просто збираюся робити самців, тому що дуже проста модель досить гарна.
Перетворивши модель там для чоловічого зросту та ваги на метричну та імітуючи 100000 біваріантних точок у R перед розрахунком окремих ІМТ, а значить, середнього ІМТ, а також обчислення середньої висоти на (середній вазі) -квадраті, виходить результат, що середній ІМТ було (до чотирьох цифр) 25,21, а було 25,22, що виглядає досить близько.
З огляду на ефект зміни параметрів, схоже, вплив використання упередженого оцінювача змінних засобів для жінок, ймовірно, буде дещо більшим, але все ще недостатньо істотним, що це може бути великою проблемою.
В ідеалі слід перевірити щось ближче до будь-якої ситуації, для якої ви хочете використовувати його, але це, мабуть, буде досить добре.
Отже, для типової ситуації, здається, навряд чи це буде великою проблемою на практиці.
[1]: Brainard, J. and Burmaster, DE (1992),
"Двовимірні розподіли для зросту та ваги чоловіків і жінок у США",
Аналіз ризиків , Vol. 12, № 2, стор 267-275
Це не зовсім правильно, але зазвичай це не призведе до величезних змін.
Наприклад, припустимо, що ваше населення має ваги 80, 90 і 100 кг, а він становить 1,7, 1,8 і 1,9 м у висоту. Тоді ІМТ - 27,68, 27,78 і 27,70. Середнє значення ІМТ становить 27,72. Якщо ви обчислите ІМТ за допомогою ваг і висот, ви отримаєте 27,78, що трохи відрізняється, але зазвичай не повинно робити все так багато.
Хоча я погоджуюся з іншими відповідями, що цілком ймовірно, що цей метод наблизить середнє значення ІМТ, я хотів би зазначити, що це лише наближення.
Я насправді схильний сказати, що ви не повинні використовувати описаний вами метод, оскільки він просто менш точний. Нераціонально обчислювати ІМТ для кожної людини, а потім приймати середнє значення, даючи реальну середню ІМТ.
Ось я проілюстрував дві крайності, коли засоби ваги та довжини залишаються однаковими, але середній ІМТ насправді різний:
Використовуючи наступний (матлаб) код:
weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');
Якщо ми просто переоформляємо довжини, ми отримуємо інше середнє ІМТ, тоді як середнє (вага) / середнє (довжина ^ 2) залишається таким же:
weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same
Знову ж таки, використовуючи реальні дані, ймовірно, ваш метод наблизить до реального середнього ІМТ, але чому б ви використовували менш точний метод?
Поза межами питання: Завжди корисно візуалізувати свої дані, щоб ви могли фактично бачити розподіли. Якщо ви помітили, наприклад, певні кластери, ви також можете розглянути можливість отримання окремих засобів для цих кластерів (наприклад, окремо для перших трьох та останніх 3 людей у моєму прикладі)