Поміркуйте, що означає підстрижений: У прототипічному випадку ви спочатку сортуєте свої дані у порядку збільшення. Потім ви підраховуєте до відсотка обрізки знизу і відкидаєте ці значення. Наприклад, звичайна 10% обрізана середня; у такому випадку ви рахуєте з найнижчого значення, поки не передасте 10% усіх даних у своєму наборі. Значення нижче цієї позначки відкладаються. Аналогічно, ви підраховуєте від найвищого значення до тих пір, поки ви не передасте свій відсоток обрізки, і встановите всі величини, що перевищують цю сторону. Тепер вам залишилось із серединою 80%. Ви берете середнє значення, і це ваша 10% підрізана середня. (Зверніть увагу, що ви можете обрізати неоднакові пропорції з двох хвостів або лише обрізати один хвіст, але ці підходи зустрічаються рідше і не здаються застосовними до вашої ситуації.)
Тепер подумайте, що трапилося б, якби ви порахували 50% обрізаного середнього. Нижня половина буде відкладена, як і верхня половина. У вас буде лише одне значення в середині (звичайно). Ви б сприйняли середню частину цього (що означає, ви просто взяли б це значення) як ваше середнє значення. Зауважте, що це значення є медіаною. Іншими словами, медіана - це порізане середнє значення (це 50% підрізане середнє). Це просто дуже агресивно. По суті, передбачається, що 99% ваших даних забруднені. Це дає вам максимальний захист від сторонніх людей за рахунок кінцевої втрати потужності / ефективності .
Я здогадуюсь, що середня / 50% обрізана середня значно агресивніша, ніж це потрібно для ваших даних, і занадто марнотратна на доступну вам інформацію. Якщо у вас є якесь відчуття частки наявних людей, я б використав цю інформацію, щоб встановити відсоток обрізки та використовувати відповідне підстрижене середнє. Якщо у вас немає жодної основи для вибору відсотка обрізки, ви можете вибрати його шляхом перехресної перевірки або використовувати надійний регресійний аналіз лише з перехопленням.