Звіт про результати підгонки кривих у науковому документі


11

(Я сподіваюся, що це питання відповідає цьому сайту; якщо ні, прийміть мої вибачення).

Я запустив певне моделювання і отримав часовий ряд y (t), t = 0, 1, ... 20. Спробувавши деякі функції, я виявив, що:

y(t) =~ 1 / (A t + B)

Де A і B - коефіцієнти, які я обчислював, використовуючи лінійну регресію, при R ^ 2> 0,99.

Який стандартний спосіб повідомляти про такі результати у науковій праці? Конкретно:

А. У мене немає теоретичного пояснення, чому результат виглядає таким чином (я знаю, що його слід зменшувати, і що він обмежений знизу, але не набагато більше). Це була лише вдала здогадка. Чи слід описати всі інші невдалі здогадки, які я спробував?

B. Щоразу, коли я запускаю симуляцію, я отримую трохи інші значення A і B. Чи повинен я просто повідомити про випадковий пробіг, або я повинен запускати симуляцію багато разів і оцінювати результати? Якщо так, то скільки разів достатньо?


Що ви хочете передати? Що являє собою кожне окреме моделювання?
Білл Барт

Це моделювання права власності на землю. Є N громадян та N земельних ділянок. Спочатку кожна земельна ділянка віддається випадковому громадянину. Потім щороку кожна земля продається з певною вірогідністю р, і якщо вона дійсно продається, покупець вибирається випадковим чином. Через 50 років я запускаю «ювілейну» процедуру, коли деякі землі повертаються початковим власникам, якщо ці власники наразі не мають землі. Я вимірюю кількість громадян без землі (у) після кожного ювілею (т). Звичайно, y (t) не збільшується. Я хочу показати, що вона зменшується передбачуваною швидкістю і що вона сходить до 0.
Ерел Сегал-Халеві

Мені здається, ви повинні тоді розробити статистичне подання і B (середнє, медіанне тощо). АБ
Білл Барт

2
Розглянемо модель з N + 1 різного виду де n = 0 N , що позначає концентрацію власників земельних ділянок з n земельних ділянок. Тепер ви можете застосувати теорію хімічної кінетики до своєї проблеми. хнн=0Nн
Смерть

Білл: ти маєш на увазі, що я повинен обчислити A і B багато разів, а потім повідомити середнє і std? Я вважаю, що кращим підходом є проведення єдиної лінійної регресії з усіма зразками з усіх симуляцій. Але скільки разів я повинен запустити моделювання?
Ерел Сегал-Халеві

Відповіді:


5

Ви намагаєтесь пристосувати закон про владу до вашого розповсюдження. Дуже цікаво. Вони весь час відображаються в теорії графіків , соціальних мережах та ряді інших місць.

Окремі навчальні посібники зі встановлення даних тут і тут .

Також, посилаючись на питання А., як залежить вірогідність покупки землі залежно від того, скільки у них землі вже є? Можливо, ви зможете використовувати модель Барбасі, щоб пояснити, чому закон про владу розумно підходить до ваших даних.

оновлення: я використав це, і він чудово працює: https://pypi.python.org/pypi/powerlaw


+1 для всіх посилань! Я також думав про закон влади, але його проста форма (y = A t ^ k) не тягне за собою форму, яку я знайшов, через константу B (y = (A t + B) ^ - 1). Чи є більш загальна форма?
Ерел Сегал-Халеві

Якщо вам цікаво описати форму кривої, тоді вам слід врахувати і змістити, перш ніж підходити до закону про потужність. Те, що у вас є B, не має відношення до форми кривої.
dranxo

Вибачте, я не зрозумів вас, що ви маєте на увазі під "тоді ви повинні фактор і зміна"?
Ерел Сегал-Халеві

Встановіть x = t + B / A. Тоді (At + B) ^ {- 1} = (A * x) ^ {- 1}, яка є формою у посиланнях.
dranxo

1
tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf
dranxo

7

Кілька думок щодо вашого запитання:

  • Те, як ви повідомляєте про свою відповідність моделі, буде дуже залежати від вашої аудиторії та вашої галузі. Наприклад, у моїй галузі дуже рідко повідомляються статистичні дані щодо моделей на зразок R ^ 2, які вважаються ні вражаючими, ні особливо корисними. Натомість деякі критерії того, як ви приїхали до моделі, до якої ви приїхали, як правило, описуються, а потім ви повідомляєте про результати своєї моделі - всі ми припускаємо, що ви насправді правильно підійшли до моделі.
  • "Я трапився через цю форму" є поганим поясненням. Справді поганий. Незважаючи на прихильність до історій випадкового генія, як відкриття пеніциліну чи хініну, "сліпа тупа удача" не є надійним науковим процесом. Наприклад, ви показали, що ця форма добре відповідає вашим даним, але ви ще не показали, що найкраще підходити до своїх даних. Сам по собі R ^ 2 не є достатнім показником для оцінки того, наскільки ваша модель відповідає вмісту даних. Дивіться квартет Anscombe .
  • Як згадував @rcompton, схоже, ви намагаєтесь підходити до розподілу закону про владу, не знаючи цього, але навіть якщо вам вдалося добре вписати закон про владу, це дійсно найкраще, якщо ви знайшли якусь причину, чому ви вважаєте, що його закон про владу . Можливо, буде досить побудувати Y з часом, перейти до CrossValided (або коледж / відділ, який зручніший для статистики) та систематично переходити до дистрибутивів, які можуть дати вам приблизно такий вигляд. Окрім розподілу закону про владу, є й інші, які можуть принести вам чудову форму.

+1 для статистики. "систематично переходите до дистрибутивів, які можуть надати приблизно такий вигляд." - де я можу їх знайти?
Ерел Сегал-Халеві

@ErelSegalHalevi Ви можете почати з CrossValided, це сестринський сайт, який стосується статистики та аналізу даних.
Фоміт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.