Чи є якась кількісна властивість населення «параметром»?


13

Я відносно знайомий з різницею між термінами статистика та параметр. Я бачу статистику як значення, отримане від застосування функції до вибіркових даних. Однак більшість прикладів параметрів стосуються визначення параметричного розподілу. Поширений приклад - середнє та стандартне відхилення для параметризації нормального розподілу або коефіцієнтів та відхилень помилок для параметризації лінійної регресії.

Однак існує багато інших значень розподілу популяції, які є менш прототиповими (наприклад, мінімальне, максимальне, r-квадрат при множинній регресії, квантил .25, медіана, кількість предикторів з ненульовими коефіцієнтами, перекос, кількість кореляцій у кореляційній матриці більше, ніж .3 тощо).

Таким чином, мої запитання :

  • Чи має бути якусь кількісну властивість населення позначати "параметром"?
  • Якщо так, то чому?
  • Якщо ні, то які характеристики не слід позначати параметром? Що вони мають маркувати? І чому?

Опрацювання плутанини

У статті Вікіпедії про оцінювачі зазначено:

"Оцінювач" або "бальна оцінка" - це статистика (тобто функція даних), яка використовується для виведення значення невідомого параметра в статистичній моделі.

Але я можу визначити невідоме значення як .25 квантил, і я можу розробити оцінювач для цього невідомого. Тобто, не всі кількісні властивості популяції - це параметри так само, як, наприклад, середнє значення і sd - параметри нормального розподілу, але справедливо намагатися оцінити будь-яку кількісну властивість населення.

Відповіді:


15

Це питання лежить в основі того, що таке статистика і як провести хороший статистичний аналіз. Це викликає багато питань, деякі термінології та інші теорії. Щоб уточнити їх, почнемо з відмітки неявного контексту питання та переходимо звідти до визначення ключових термінів "параметр", "властивість" та "оцінювач". На декілька частин запитання дано відповіді під час обговорення. В заключному заключному розділі узагальнено основні ідеї.

Державні простори

Загальне статистичне використання "розподілу", як у "Нормальному розподілі з PDF, пропорційним "- це насправді (серйозна) зловживання англійською мовою, оскільки, очевидно, це не один розподіл: це ціла родина розподілів,параметризованасимволамиμтаσ. Стандартне позначення для це "простір стану"Ω,множинаexp(12(xμ)/σ)2)dxμσΩрозподілів. (Я дещо спрощую тут для викладу і продовжуватимуть спрощуватись, коли ми йдемо далі, залишаючись максимально жорсткими.) Його роль полягає у визначенні можливих цілей наших статистичних процедур: коли ми щось оцінюємо, ми підбір одного (а іноді і більше) елементів .Ω

Іноді простори станів явно параметризуються, як у . У цьому описі є відповідність один на один між набором кортежів { ( μ , σ ) } у площині верхньої половини та набором розподілів, які ми будемо використовувати для моделювання наших даних. Одне значення такої параметризації полягає в тому, що тепер ми можемо конкретно посилатися на розподіли в Ω за допомогою впорядкованої пари дійсних чисел.Ω={N(μ,σ2)|μR,σ>0}{(μ,σ)}Ω

В інших випадках простіри станів не є явними параметрами. Прикладом може бути набір усіх одномодальних безперервних розподілів. Нижче ми розглянемо питання про те, чи в будь-якому випадку в таких випадках можна знайти адекватну параметризацію.

Параметризації

Як правило, параметризація з , є відповідність (математична функція ) з підмножини R дг кінцева) , щоб Ом . Тобто він використовує впорядковані набори d -tuples для позначення розподілів. Але це не просто будь-яке листування: воно повинно бути «добре поведене». Щоб зрозуміти це, розглянемо набір усіх постійних розповсюджень, PDF-файли яких мають кінцеві очікування. Це широко розглядалося б як "непараметричне", в тому сенсі, що будь-яка "природна" спроба параметризації цього набору буде включати в себе лічильну послідовність дійсних чисел (з використанням розширення на будь-якій ортогональній основі). Тим не менше, оскільки цей набір має кардинальність ΩRddΩd , що є кардинальністю дій, між цими розподілами та R повинно існувати певна відповідність. Парадоксально, але, здавалося б, це зробило бпараметризованийпростір станівєдинимреальним параметром!1R

Парадокс вирішується, зазначивши, що одне реальне число не може насолоджуватися "приємними" відносинами з розподілами: коли ми змінюємо значення цього числа, розподіл, якому він відповідає, у деяких випадках повинен змінюватися радикально. Ми виключаємо такі "патологічні" параметризації, вимагаючи, щоб розподіли, що відповідають близьким значенням їх параметрів, самі повинні бути "близькими" один до одного. Обговорення відповідних визначень "близько" заведе нас далеко, але я сподіваюся, що цього опису достатньо, щоб продемонструвати, що параметр є набагато більшим, ніж просто називати певний розподіл.

Властивості розподілів

Завдяки багаторазовому застосуванню ми звикаємо думати про «властивість» розподілу як про якусь зрозумілу кількість, яка часто з’являється в нашій роботі, як-от її очікування, дисперсія тощо. Проблема з цим як можливим визначенням "власності" полягає в тому, що це занадто розпливчасте і недостатньо загальне. (Ось де математика була в середині 18 століття, де "функції" розглядалися як кінцеві процеси, застосовані до об'єктів.) Натомість про єдине розумне визначення поняття "властивість", яке завжди буде працювати, - це мислити властивість як будучи числом, яке однозначно присвоюється кожному розподілу в Ω. Сюди входять середнє значення, дисперсія, будь-який момент, будь-яке алгебраїчне поєднання моментів, будь-яке квантил і багато іншого, включаючи речі, які навіть неможливо обчислити. Однак він не включає речі, які не мали б сенсу для деяких елементів . Наприклад, якщо Ω складається з усіх розподілів Student t, середнє значення не є дійсним властивістю для Ω (оскільки t 1 не має середнього значення). Це ще раз вражає нас, наскільки наші ідеї залежать від того, з чого насправді складається Ω .ΩΩΩt1Ω

Властивості не завжди є параметрами

Властивість може бути настільки складною функцією, що вона не послужила б параметром. Розглянемо випадок "Нормального розподілу". Ми можемо хотіти знати, чи є середнє значення справжнього розподілу при округленні до найближчого цілого числа. Це властивість. Але він не буде служити параметром.

Параметри - це не обов'язково властивості

Якщо параметри та розподіли знаходяться у відповідності один до одного, то, очевидно, будь-який параметр і будь-яка функція параметрів для цього питання є властивістю згідно нашого визначення. Але між параметрами та розподілами не повинно бути однозначного відповідності: іноді кілька розподілів повинні бути описані двома або більше чітко різними значеннями параметрів. Наприклад, параметр розташування для точок на кулі, природно, використовував би широту та довготу. Це добре - за винятком двох полюсів, які відповідають заданій широті та будь-якій дійсній довготі. місце(точка на сфері) дійсно є властивістю, але довгота її не обов'язково є власністю. Хоча існують різні ухили (наприклад, просто оголосити довготу полюса нульовою, наприклад), ця проблема підкреслює важливу концептуальну різницю між властивістю (яка однозначно пов'язана з розподілом) та параметром (що є способом маркування розподіл може бути і не унікальним).

Статистичні процедури

Ціль оцінки називається оцінкою . Це просто власність. Статистик не може вибрати оцінку: це провінція її клієнта. Коли хтось до вас звернеться зі зразком сукупності і попросить вас оцінити 99-й відсоток населення, ви, швидше за все, звільниться, подавши оцінку середнього рівня! Ваша робота, як статистик, полягає в тому, щоб визначити хороший порядок оцінки оцінки, яку ви отримали. (Іноді ваша робота полягає в тому, щоб переконати свого клієнта, що він вибрав неправильну оцінку для своїх наукових цілей, але це вже інше питання ...)

Ω

Оцінювачі

ΩΩ

tθ FΩFst(s)θ(F)Ft(s)θ(F)FΩ

FΩt1tt

("Баєсівський" статистик завжди буде порівнювати ризики шляхом усереднення за "попереднім" розподілом можливих станів (як правило, надається клієнтом). Статистик "частота" може зробити це, якщо такий попередній обгрунтовано існує, але він також готовий порівнюйте ризики іншими способами ухилення від байесів.)

Висновки

tθθtθθ

Ωt


2
Ω

11

Як і у багатьох запитаннях щодо визначень, відповіді повинні бути прицілені як до основних принципів, так і до того, як терміни використовуються на практиці, які часто можуть бути хоч трохи розкутими або непослідовними, навіть з боку осіб, які добре обізнані, і багато іншого що важливо, змінний від громади до спільноти.

Один загальний принцип полягає в тому, що статистика - це властивість вибірки, і відома константа, а параметр - відповідна властивість сукупності, і так невідома константа. Слово "відповідне" тут слід розуміти як досить еластичне. Між іншим, саме це відмінність і саме ця термінологія мають менше століття, введені Р. А. Фішером.

Але

  1. Набір вибірки та сукупності не характеризує всіх наших власних проблем. Часові ряди - один з основних класів прикладів, коли ідея є скоріше основним процесом генерування, і щось подібне, можливо, є глибшою та загальнішою ідеєю.

  2. Існують налаштування, в яких змінюються параметри. Знову ж, аналіз часових рядів дає приклади.

  3. До головного, ми на практиці не вважаємо всі властивості популяції чи процесу як параметри. Якщо деяка процедура передбачає модель нормального розподілу, то мінімальний і максимальний не є параметрами. (Дійсно, згідно з моделлю, мінімум і максимум є довільно великими від’ємними і позитивними числами в будь-якому випадку, не те, що нас повинно турбувати.)

Я б сказав, що колись Вікіпедія вказує тут у правильному напрямку, і практика, і принцип дотримуються, якщо ми говоримо, що параметр - це все, що ми оцінюємо .

Це допомагає і з іншими питаннями, які викликали спантеличення. Наприклад, якщо ми обчислимо порізану середню на 25%, що ми оцінюємо? Обґрунтованою відповіддю є відповідна властивість населення, яка по суті визначається методом оцінки. Однією з термінологій є те, що оцінювач має оцінку, що б не оцінював. Починаючи з якоїсь платонічної ідеї властивості "там" (скажімо, спосіб розподілу) і продумувати, як оцінити це розумно, як і придумувати хороші рецепти для аналізу даних і продумувати те, що вони мають на увазі, коли вони розглядаються як умовивід.

Як часто в прикладній математиці чи науці, є параметр двоякий аспект. Ми часто думаємо про це як про щось справжнє, що ми виявляємо, але також правда, що це щось визначене нашою моделлю процесу, так що воно не має сенсу поза контекстом моделі.

Два досить різні моменти:

  1. Багато вчених використовують слово "параметр" так, як статистики використовують змінну. У мене є людина вченого, а також статистична, і я б сказав, що це прикро. Змінні та властивості - це кращі слова.

  2. У дивовижному вживанні англійської мови надзвичайно поширене, що цей параметр вважається обмеженням або межами, які можуть бути наслідком деякої первісної плутанини між "параметром" і "периметром".

Примітка про оціночну точку зору

Класична позиція полягає в тому, що ми визначаємо параметр заздалегідь, а потім вирішуємо, як його оцінити, і це залишається практикою більшості, але повернення процесу не є абсурдним і може бути корисним для деяких проблем. Я називаю це точкою зору оцінки. Це в літературі принаймні 50 років. Тукі (1962, с. 60) закликав це

"Ми повинні приділити ще більше уваги тому, щоб почати з оцінювача і виявити, що є розумною оцінкою, і виявити, що розумно вважати оцінювачем як оцінним".

Подібну точку зору були досить детально та глибоко розроблені Біккелем та Леманном (1975) та неофіційно із значною дохідливістю від Мостеллера та Тукі (1977, с. 32-34).

Існує також елементарна версія. Використовувати (скажімо) вибіркове медіанне або геометричне середнє для оцінки відповідного параметру сукупності має сенс незалежно від того, чи є базовий розподіл симетричним, і та сама ж репутація може бути поширена на (наприклад) вибірки обрізаних засобів, які розглядаються як оцінки їх популяційних аналогів .

Бікель, PJ та Е. Л. Леманн. 1975. Описова статистика непараметричних моделей. II. Місцезнаходження . Анали статистики 3: 1045-1069.

Mosteller, F. та JW Tukey. 1977. Аналіз даних та регресія. Редінг, MA: Аддісон-Веслі.

Tukey, JW 1962. Майбутнє аналізу даних . Анали математичної статистики 33: 1-67.


Значна частина цього виглядає на розбіжності зі стандартною статистичною літературою, особливо з вашим визначенням параметра. Схоже, це заплутує процеси пошуку процедури для обчислення оцінки та визначення того, що слід оцінити. Останнє - обираючи оцінку, - питання, яке слід визначити вченого чи слідчого. Після цього статистик вибирає перше, щоб мати бажані властивості серед усіх можливих процедур оцінки оцінки. Є також технічні питання; Досить сказати, що параметр є більш обмеженим, ніж довільна оцінка.
whuber

Я розгорну свою відповідь, щоб вирішити це.
Нік Кокс

1
Я погоджуюся з Тукі, хоча ви можете подумати з моєї відповіді на цю тему, що я є одним із "окостенілих" статистиків, які він оскаржує. Проблема в тому, що ви вивели його цитату з контексту. Тукі спеціально займається питанням, як оцінити властивості процедур, "коли гіпотези, щодо яких вони зазвичай розробляються, не дотримуються". Це жодним чином не змінює визначення таких речей, як параметри, оцінки та оцінки. Зокрема, параметр все ще не є "тим, що ми оцінюємо".
whuber

3
Тут багато їжі для роздумів. Як швидка відповідь: Моя відповідь не мала на меті означати, що ми знаходимось у залі Свободи, куди що завгодно. Контекст цитати Tukey я вітаю, оскільки моя точка зору полягає в тому, що зазвичай звичні гіпотези не дотримуються, оскільки всі моделі є наближеннями, не зовсім узгодженими з даними. Цей пункт, поки не кусається, підкреслює значення різних точок зору. Взагалі, я не намагаюся створити більш абстрактні та більш математично уточнені формальні визначення і не кваліфікуюсь.
Нік Кокс

6


pdf=12πσ2e12(xiμ)2σ2
12π3.1415926e2.718281828Xxiзначення також. Іншими словами, як тільки я знаю, що вищевказане рівняння - це те, над чим я повинен працювати, я знаю все, що треба знати, як тільки я дізнаюся значення для таμσ2 . Ці значення є параметрами . Зокрема, це невідомі константи, які контролюють поведінку розподілу. Так, наприклад, якщо я хотів би знати значення , яке відповідає , можна визначити , що (або що - небудь ще про те , що розподіл), після того, знаючи і (але не навпаки). Наведені вище привілеї рівнянняX25th%μσ2μі таким чином, що це не має жодного іншого значення. σ2

Так само, якби я працював із моделлю множинної регресії OLS, де передбачається процес генерування даних: потім, як тільки я дізнаюся (на практиці, оцінюю ) значення , , , і , я знаю, що все є знати . Все інше, наприклад умовного розподілу де , я можу обчислити, виходячи зі свого знання
β 0 β 1 β 2 σ 2 25- й % Y X = x i β 0 β 1 β 2 σ 2 β 0 β 1 β 2 σ 2

Y=β0+β1X1+β2X2+εwhere εN(0,σ2)
β0β1β2σ225th%YX=xiβ0, , та . Модель множинної регресії вище привілеїв , , та таким чином, що вона не має жодного іншого значення. β1β2σ2β0β1β2σ2

(Все це, безумовно, передбачає, що моя модель розподілу населення або процесу генерування даних є правильною. Як завжди, слід пам’ятати, що «всі моделі неправильні, але деякі корисні» - Джордж Бокс .)

Щоб відповісти на ваші запитання більш чітко, я б сказав:

  • Ні, будь-які старі кількісні належним чином не повинні бути позначені "параметром".
  • н / в
  • Характеристики, які мають бути позначені "параметром", залежать від специфікації моделі. У мене немає спеціальної назви для інших кількісних характеристик, але я думаю , що було б добре , щоб називати їх властивість або характеристику або наслідки і т.д.

Спасибі. Але яку термінологію ви використовуєте для опису всіх тих значень сукупності, які можуть бути отримані з параметричної моделі, але не містяться в наборі зручних параметрів для представлення цієї моделі? Або ж може виникнути випадок, коли ви не знаєте моделі населення і не особливо дбаєте, але цікавитесь певним нестандартним аспектом моделі населення.
Джеромі Англім

У мене немає загальноприйнятого спеціального імені, але є імена для певних значень. Наприклад, якщо ви не вірите в те, що ваше населення достатньо близьке до будь-якого добре вивченого розподілу, ви можете спробувати охарактеризувати його за медіаною, квартілями, шарнірними точками тощо
gung - Відновіть Моніку

3
Тонка проблема щодо параметрів піддається старому комп'ютерному трюку: візьміть двійкові (або десяткові) подання та та переплетете їх (по чотири групи), щоб створити новий двійковий (або десяткове) число . Очевидно, що процес є оборотним: ви можете прочитати з першої, п'ятої, дев'ятої, ... і т.д. цифр тощо. Тому "раз [ви] дізнаєтесь значення , [ви] знаєте все, що потрібно знати". Але це НЕ є допустимим параметр в зв'язку зі спотвореним способом , в якому він маркує можливі розподілу. σ θ β 0 θ θ θβ0,β1,β2,σθβ0θθθ
качан

3

На це питання було кілька чудових відповідей, я просто подумав, що підсумую цікаву посилання, яка забезпечує досить жорстке обговорення оцінок.

Сторінка віртуальних лабораторій на оцінювачах визначає

  • статистики як «спостережувана функція змінного результату».
  • "у технічному сенсі параметр є функцією розподілу X"θ

Поняття функції розподілу є дуже загальною ідеєю. Таким чином, кожен приклад, поданий вище, можна розглядати як функцію певного розподілу.

  • Кожен квантиль, включаючи міні, медіану, 25 квантиль, макс, може бути функцією розподілу.
  • Косоокість - це функція розподілу. Якщо розподіл населення нормальний, то вони будуть нульовими, але це не зупиняє обчислення цих значень.
  • Підрахунок числа кореляцій, що перевищує певне значення, є функцією коваріаційної матриці, що, в свою чергу, є функцією багатоваріантного розподілу.
  • R-квадрат - це функція розподілу.

1
Однією з причин, що я запропонував більш детальну відповідь, є те, що це визначення "параметра" недостатньо добре. Для одного контрприкладу див. Мій коментар до відповіді @ gung . Інтуїтивно зрозумілий набір параметризованих розподілів утворює кінцево-розмірне топологічне багатоманіття - з межею; Параметр повинен бути безперервною функцією, визначеною на колекторі. Це більше, ніж просто технічна вимога, оскільки вона стосується розподілу вибірки оцінок.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.