Використання комп’ютерного моделювання для кращого розуміння статистичних понять на рівні випускників


11

Привіт, я беру аспірантуру зі статистики, і ми охоплювали тестові статистики та інші концепції.

Однак мені часто вдається застосувати формули та розвинути своєрідну інтуїцію щодо того, як працюють речі, але я часто залишаюсь з відчуттям, що, можливо, якщо я підкріплюю своє дослідження симульованими експериментами, я розвину кращу інтуїцію в проблемних ситуаціях .

Отже, я думав написати прості симуляції, щоб краще зрозуміти деякі концепції, які ми обговорюємо на уроці. Тепер я міг би сказати Java для:

  1. Виробляють випадкову сукупність із нормальним середнім та стандартним відхиленням.
  2. Потім візьміть невеликий зразок і спробуйте емпірично обчислити помилки типу I та типу II.

Тепер у мене є такі питання:

  1. Це законний підхід до розвитку інтуїції?
  2. Чи є це програмне забезпечення для цього ( SAS?, R?)
  3. це дисципліна в статистиці, яка займається таким програмуванням: експериментальна статистика ?, обчислювальна статистика? моделювання?

1
Я весь час використовую імітацію, щоб спробувати краще зрозуміти, що відбувається. Ви можете використовувати майже будь-яку мову програмування або статистичну програму для проведення таких типів експериментів (навіть Excel).
Джон

1
+1, симуляції та фігури - це 2 найбільш корисних методики побудови інтуїції. Я використовував їх зазвичай для того, щоб допомогти іншим та самому зрозуміти речі. Є багато відповідей на питання з резюме, які використовують символи для ілюстрації матеріалів. Якщо ви хочете декількох посилань, я міг би легко перерахувати деякі власні відповіді, які таким чином використовували симси. Ви також можете задати тут питання про резюме; наприклад, "Я намагаюся зрозуміти _____, але у мене виникають труднощі, чи може хтось надати пояснення з sim, що зробить це зрозумілішим?" або: "Я зробив цю сім'ю, і це говорить про те, що вона працює так, чи не так?"
gung - Відновіть Моніку

4
Прагнучи задовольнити високі стандарти та сподівання цього сайту, я використовую імітацію (а також теоретичні виведення та ілюстрації) у кожній відповіді, яка від цього виграє. Значна частина моїх останніх відповідей буде включати певну форму імітації, особливо майже будь-яку відповідь на запитання з тегом r . Наприклад, ви можете переглянути їх на сторінці пошуку, якщо вам це цікаво.
whuber

2
Ви знайдете безліч чудових, переглянувши відповіді @ whuber. Оскільки мої відповіді (та можливості програмування), як правило, менш складні, вони можуть зробити хороший перший крок. Я використовую sim, щоб показати, що важко використовувати модель fit, щоб вибрати найкраще посилання в GLiM тут: різниця між-logit-і-probit-моделями . Тут я використовую сим, щоб показати, як падає потужність, коли розміри груп стають неоднаковими в t-тесті: як слід інтерпретувати порівняння засобів різних розмірів вибірки .
gung - Відновіть Моніку

2
Питання з резюме: пояснення статистичного моделювання може також зацікавити читачів цієї теми.
gung - Відновіть Моніку

Відповіді:


7

Мені подобається ваше запитання, але у вас немає конкретних відповідей на 2 і 3? Я думаю, що такі програмні пакети, як SAS (загалом кажучи про продукти SAS, а не лише SAS / STAT), можуть мати інструменти, які полегшують моделювання, але я не можу сказати напевно. Я не думаю, що така річ підходить як галузь математики чи статистики.

Тепер питання 1 - на чому я хотів би зосередитись. Моделювання може допомогти у вивченні статистики на всіх рівнях і може сприяти загальним статистичним дослідженням. Дійсно, існують журнали, орієнтовані на моделювання та обчислення. Навіть FDA визнає важливість моделювання при розробці клінічних випробувань та допомагає передбачити результати.

У 1960-х роках Джуліан Саймон викладав вступну статистику, використовуючи моделювання як мотиватор. Незважаючи на суперечливість, він пізніше стверджував, що перед Ефроном він робив перекомпонування (перестановка та завантажувальна програма). Він опублікував книгу, використовуючи ці ідеї в 1969 р. Це, безумовно, бракувало теорії і було лише навчальним посібником, а не новим підходом до статистичного оцінювання. Він не розвинув жодної з математичних властивостей, які виникали з Ефроном і після нього.

Я думаю, що для вступної статистики корисно робити моделювання, щоб продемонструвати розподіл вибірки, показати, як виникає теорема про центральну межу, а фізичне моделювання через квінкункс демонструє версію теореми про центральну межу DeMoivre - Laplace.

Іноді це підсилює інтуїцію. Я думаю, що проблема Монті Холл викликає спантеличення і, здавалося б, парадоксальна навіть для таких математиків, як Пол Ердос. Але імітувати гру часто дуже переконливо. Є багато ймовірних проблем, які є контрінтуїтивними, і симуляція може, я думаю, допомогти.

У 1978 році, коли я працював над доктором теорії екстремальних значень, у мене з'явилася інтуїтивна ідея граничної теореми, яку я намагався довести. Я боровся з математикою. Тоді я вирішив моделювати стохастичний процес і моделювання «підтвердило» мій результат. Це дало мені впевненість наполягати на тому, щоб довести це.

Тож навіть на рівні випускників та поза ними моделювання може бути корисним двома способами.

  1. Щоб допомогти розвинути інтуїцію, як ви пропонуєте в питанні 1, але також

  2. Для підтвердження інтуїції, як я робив у своїй дисертації


Я знайшов когось, хто вирішив проблему Monty Hall в SAS та R тут sas-and-r.blogspot.com/2010/01/… - насолоджуйтесь
користувач1172468

Сьюзен Холмс із Стенфордського університету кілька років тому розмістила на своєму веб-сайті симуляцію гри Monty Hall. Дякуємо, що нагадали нам @ user1172468, що багато людей можуть і, ймовірно, проводять моделювання на своїх веб-сайтах.
Майкл Р. Черник

Проблема Monty Hall з R (дуже легко підписатись): bodowinter.com/tutorial/bw_doodling_monty_hall.pdf
vasili111

8
  1. Так. Адже мова йде про вашу інтуїцію.
  2. R тобі добре підійде. Кодування буде для вас досить простим, якщо ви вже знаєте Java (або будь-яку іншу "стандартну мову програмування" для цього).
  3. Обчислювальна статистика займається розробкою алгоритмів для впровадження статистичних методів, ймовірно, це найближче до того, що ви намагаєтесь описати тут.

Веселіться своїм курсом!


Я думаю, що ваша відповідь комплімент моя. Я дав детальну відповідь на 1, і ви надали більш чітку відповідь на 2 і 3. Ви, здається, відповідаєте на питання протягом декількох хвилин. Ми, мабуть, перекривались. У будь-якому випадку ви дали 2 хороших відповіді, і я дав вам нагороди за них!
Майкл Р. Черник

Дякую за великі пальці! Здається, ти на крок попереду мене у відповіді. :)
usεr11852

Продовжуйте відповідати. Я збираюся відпочити. Я майже досяг свого щоденного ліміту повторень.
Майкл Р. Черник

Хлопці, я вважав, що обидві відповіді хороші. Я вибрав відповідь @ Майкла, тому що я можу вибрати лише одну правильну відповідь, і я відчув, що вирішував деякі більш фундаментальні проблеми.
користувач1172468

1
@ user1172468 Вам дійсно не потрібно пояснювати, але приємно, що ви зробили.
Майкл Р. Черник

4

Пакет TeachingDemos для R народився з аналогічного розумового процесу, як і ваш, намагаючись по-різному уявити та зрозуміти поняття. У пакеті є функції, які використовують моделювання, щоб допомогти зрозуміти деякі ключові поняття. Версія розробки (R-forge, але ще не на CRAN) включає в себе функцію "simfun", яку можна використовувати для створення функцій моделювання для подальшої допомоги у моделюванні.



1
Також список інших посилань на викладання та навчання статистики з R: cran.r-project.org/web/views/TeachingStatistics.html
vasili111
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.