Це визначення статистики у wikipedia
Більш формально, статистична теорія визначає статистику як функцію вибірки, де сама функція не залежить від розподілу вибірки; тобто функцію можна заявити перед реалізацією даних. Термін статистика використовується як для функції, так і для значення функції на даному вибірці.
Я думаю, що я розумію більшість цього визначення, проте частина - де функція не залежить від розподілу вибірки, я не зміг розібратися.
Моє розуміння статистики поки що
Зразок являє собою набір реалізацій деякого числа незалежних однаково розподілений (IID) , випадкові величини з розподілом F (10 реалізацій рулону 20 односторонній справедливої кістки, 100 реалізацій 5 рулонів 6 ти односторонній справедливої кістки, випадковим чином залучити 100 чоловік з населення).
Функція, домен якої є набором, і діапазон яких є реальними числами (або, можливо, вона може виробляти інші речі, наприклад, вектор або інший математичний об'єкт ...) вважатиметься статистикою .
Коли я думаю про приклади, середня, медіанна дисперсія, все це має сенс у цьому контексті. Вони є функцією на сукупності реалізацій (вимірювання артеріального тиску з випадкової вибірки). Я також бачу, як лінійну регресійну модель можна вважати статистикою - це не просто функція на множині реалізацій?
Де я розгублений
Припускаючи, що моє розуміння зверху правильне, я не зміг зрозуміти, де функція може не залежати від розподілу вибірки. Я намагався придумати приклад, щоб зрозуміти його, але не пощастило. Будь-яке розуміння було б дуже вдячно!