Тут ігноруйте інші відповіді. Це насправді зовсім не парадокс. Справжня проблема, яку тут, мабуть, ігнорують усі, - це те, що ви помиляєтесь, на яку вірогідність насправді дивитесь. Насправді є дві абсолютно різні середні показники та статистичні дані, які обидва мають власне використання та інтерпретацію у запропонованому вами прикладі (маркетинг)!
По-перше, це середня кількість товарів, придбаних на одного клієнта. Так в середньому один клієнт купує 1,6 предмета. Звичайно, замовник не може не 0,6 продукту (якщо припустити, що це не щось на зразок рису чи зерна, пов'язане з ним постійне вимірювання).
По-друге, є середня кількість покупців, які купують певний товар. Звучить дивно правильно? Так що в середньому продукт має 5,33333333 ... покупці купують його. Однак це інакше. Тут ми описуємо не кількість придбаних товарів (їх всього три!), А кількість людей, які фактично купують цей продукт.
Подумайте про ці два значення таким чином: Що б представляли ці два значення, якби був лише один клієнт або лише один продукт? Зрештою, середнє значення однієї точки даних - це саме те, що задано точкою даних.
Або ще краще, подумайте про графік так, ніби він дає вам доларові суми, витрачені на придбання товару. Очевидно, що середня сума, витрачена окремим клієнтом, буде набагато меншою, ніж сума грошей, вироблених в середньому продуктом, що постачається великою корпорацією (або навіть просто малим бізнесом). Я впевнений, що ви можете придумати хороші способи використання обох цінностей, обговорюючи добробут компанії.
Коли ти йдеш пояснювати це маркетинговим працівникам, поясни це їм так само, як я вже сказав. Це не парадокс. Це просто зовсім інша статистика. Єдине питання тут було помітити, що насправді існують два різні способи зчитування діаграми (тобто кількість людей, які купують за продукт порівняно з кількістю товарів, придбаних на людину).
tl; dr. Перше, що ви описали, - це середня сума, яку окремий клієнт готовий витратити, купуючи вашу продукцію. Другий - середній попит населення на дану продукцію. Я впевнений, що зараз ви можете зрозуміти, чому обоє, безумовно, не те саме. Порівнюючи їх як такі, просто ви дасте інформацію про сміття.
EDIT
Здається, питання насправді задає питання про середні гроші, витрачені клієнтами, які купують якийсь товар a, b або c. Добре. Це насправді лише помилка в розрахунках. Я б не назвав це парадоксом. Це справді просто тонкий флюб.
Подивіться на свої стовпці. Між стовпцями є люди, якими ділиться. Припустимо, ви зробили відповідну середньозважену середню. Ви ще двічі додаєте людей. Це означає, що середній показник міститиме зайвих людей із значенням, більшим або рівним 2. Тепер, який був ваш середній показник? Це було 1,6! По суті ваш середній показник виглядає приблизно так:
∑ni=0valueOfPersoni∗valueOfPersonin
Це, безумовно, не правильна формула. Це середньозважене значення, хоча припускаючи взаємну ексклюзивність, саме так ви б налаштувались, щоб отримати справжнє середнє у вашій ситуації.
∑ni=0numberOfPeopleBuyingi∗averageSpentByPersonBuyingin
У будь-якому випадку ви отримаєте заплутану середню. Однією помилкою було ігнорування необхідності середньозваженого середнього показника, оскільки одна категорія має більшу "вагу" щодо середнього. Це як щільність. Одне значення щільніше у людей представляє. Інше питання - це додавання дублікатів, яке буде спотворювати середнє значення. Я не називаю жодного з цих "парадоксів". Коли я побачив, що ти робиш, мені здалося очевидним, чому це не вийде. Середньозважений рівень дещо сам собою пояснює свою потребу, і я думаю, що тепер, коли ви бачите, що ви додавали значення кілька разів ... це не може працювати. Ви в основному взяли середнє значення квадратів їх значень.