Це питання лежить в основі того, що таке статистика і як провести хороший статистичний аналіз. Це викликає багато питань, деякі термінології та інші теорії. Щоб уточнити їх, почнемо з відмітки неявного контексту питання та переходимо звідти до визначення ключових термінів "параметр", "властивість" та "оцінювач". На декілька частин запитання дано відповіді під час обговорення. В заключному заключному розділі узагальнено основні ідеї.
Державні простори
Загальне статистичне використання "розподілу", як у "Нормальному розподілі з PDF, пропорційним "- це насправді (серйозна) зловживання англійською мовою, оскільки, очевидно, це не один розподіл: це ціла родина розподілів,параметризованасимволамиμтаσ. Стандартне позначення для це "простір стану"Ω,множинаexp(−12(x−μ)/σ)2)dxμσΩрозподілів. (Я дещо спрощую тут для викладу і продовжуватимуть спрощуватись, коли ми йдемо далі, залишаючись максимально жорсткими.) Його роль полягає у визначенні можливих цілей наших статистичних процедур: коли ми щось оцінюємо, ми підбір одного (а іноді і більше) елементів .Ω
Іноді простори станів явно параметризуються, як у . У цьому описі є відповідність один на один між набором кортежів { ( μ , σ ) } у площині верхньої половини та набором розподілів, які ми будемо використовувати для моделювання наших даних. Одне значення такої параметризації полягає в тому, що тепер ми можемо конкретно посилатися на розподіли в Ω за допомогою впорядкованої пари дійсних чисел.Ω={N(μ,σ2)|μ∈R,σ>0}{(μ,σ)}Ω
В інших випадках простіри станів не є явними параметрами. Прикладом може бути набір усіх одномодальних безперервних розподілів. Нижче ми розглянемо питання про те, чи в будь-якому випадку в таких випадках можна знайти адекватну параметризацію.
Параметризації
Як правило, параметризація з , є відповідність (математична функція ) з підмножини R д (з г кінцева) , щоб Ом . Тобто він використовує впорядковані набори d -tuples для позначення розподілів. Але це не просто будь-яке листування: воно повинно бути «добре поведене». Щоб зрозуміти це, розглянемо набір усіх постійних розповсюджень, PDF-файли яких мають кінцеві очікування. Це широко розглядалося б як "непараметричне", в тому сенсі, що будь-яка "природна" спроба параметризації цього набору буде включати в себе лічильну послідовність дійсних чисел (з використанням розширення на будь-якій ортогональній основі). Тим не менше, оскільки цей набір має кардинальність ℵΩRddΩd , що є кардинальністю дій, між цими розподілами та R повинно існувати певна відповідність. Парадоксально, але, здавалося б, це зробило бпараметризованийпростір станівєдинимреальним параметром!ℵ1R
Парадокс вирішується, зазначивши, що одне реальне число не може насолоджуватися "приємними" відносинами з розподілами: коли ми змінюємо значення цього числа, розподіл, якому він відповідає, у деяких випадках повинен змінюватися радикально. Ми виключаємо такі "патологічні" параметризації, вимагаючи, щоб розподіли, що відповідають близьким значенням їх параметрів, самі повинні бути "близькими" один до одного. Обговорення відповідних визначень "близько" заведе нас далеко, але я сподіваюся, що цього опису достатньо, щоб продемонструвати, що параметр є набагато більшим, ніж просто називати певний розподіл.
Властивості розподілів
Завдяки багаторазовому застосуванню ми звикаємо думати про «властивість» розподілу як про якусь зрозумілу кількість, яка часто з’являється в нашій роботі, як-от її очікування, дисперсія тощо. Проблема з цим як можливим визначенням "власності" полягає в тому, що це занадто розпливчасте і недостатньо загальне. (Ось де математика була в середині 18 століття, де "функції" розглядалися як кінцеві процеси, застосовані до об'єктів.) Натомість про єдине розумне визначення поняття "властивість", яке завжди буде працювати, - це мислити властивість як будучи числом, яке однозначно присвоюється кожному розподілу в Ω. Сюди входять середнє значення, дисперсія, будь-який момент, будь-яке алгебраїчне поєднання моментів, будь-яке квантил і багато іншого, включаючи речі, які навіть неможливо обчислити. Однак він не включає речі, які не мали б сенсу для деяких елементів . Наприклад, якщо Ω складається з усіх розподілів Student t, середнє значення не є дійсним властивістю для Ω (оскільки t 1 не має середнього значення). Це ще раз вражає нас, наскільки наші ідеї залежать від того, з чого насправді складається Ω .ΩΩΩt1Ω
Властивості не завжди є параметрами
Властивість може бути настільки складною функцією, що вона не послужила б параметром. Розглянемо випадок "Нормального розподілу". Ми можемо хотіти знати, чи є середнє значення справжнього розподілу при округленні до найближчого цілого числа. Це властивість. Але він не буде служити параметром.
Параметри - це не обов'язково властивості
Якщо параметри та розподіли знаходяться у відповідності один до одного, то, очевидно, будь-який параметр і будь-яка функція параметрів для цього питання є властивістю згідно нашого визначення. Але між параметрами та розподілами не повинно бути однозначного відповідності: іноді кілька розподілів повинні бути описані двома або більше чітко різними значеннями параметрів. Наприклад, параметр розташування для точок на кулі, природно, використовував би широту та довготу. Це добре - за винятком двох полюсів, які відповідають заданій широті та будь-якій дійсній довготі. місце(точка на сфері) дійсно є властивістю, але довгота її не обов'язково є власністю. Хоча існують різні ухили (наприклад, просто оголосити довготу полюса нульовою, наприклад), ця проблема підкреслює важливу концептуальну різницю між властивістю (яка однозначно пов'язана з розподілом) та параметром (що є способом маркування розподіл може бути і не унікальним).
Статистичні процедури
Ціль оцінки називається оцінкою . Це просто власність. Статистик не може вибрати оцінку: це провінція її клієнта. Коли хтось до вас звернеться зі зразком сукупності і попросить вас оцінити 99-й відсоток населення, ви, швидше за все, звільниться, подавши оцінку середнього рівня! Ваша робота, як статистик, полягає в тому, щоб визначити хороший порядок оцінки оцінки, яку ви отримали. (Іноді ваша робота полягає в тому, щоб переконати свого клієнта, що він вибрав неправильну оцінку для своїх наукових цілей, але це вже інше питання ...)
Ω
Оцінювачі
ΩΩ
tθ F∈ΩFst(s)θ(F)Ft(s)θ(F)FΩ
F∈Ωt1tt
("Баєсівський" статистик завжди буде порівнювати ризики шляхом усереднення за "попереднім" розподілом можливих станів (як правило, надається клієнтом). Статистик "частота" може зробити це, якщо такий попередній обгрунтовано існує, але він також готовий порівнюйте ризики іншими способами ухилення від байесів.)
Висновки
tθθtθθ
Ωt