Історія:
Бабуся ходить, але не лізе. Деякі бабусі це роблять. Одна бабуся славилася сходженням на Кіліманджаро .
Цей дрімаючий вулкан великий. Це 16000 футів над його базою. (Не ненавиджу мої імператорські загони.) Іноді вгорі є льодовики.
Якщо ви піднімаєтесь на рік, де немає льодовика, і ви потрапляєте на вершину, чи це такий самий верх, як ніби був льодовик? Висота різна. Шлях, який ви повинні пройти, відрізняється. Що робити, якщо піти на вершину, коли товщина льодовика більша? Це робить це більше досягненням? Близько 35 000 людей намагаються піднятися на нього щороку, але лише близько 16 000 досягають успіху.
Застосування:
Отже, я б пояснив бабусі контроль ваг (він мінімізував складність моделі):
Бабусю, ваш мозок - дивовижний мислитель, чи ви це знаєте чи ні. Якщо я запитаю вас, скільки з 16000, які думають, що дійсно дійшли до вершини, насправді так і зробили, ви б сказали «всі вони».
Якщо я вдягнув датчики у взуття всіх 30000 альпіністів і виміряв висоту над рівнем моря, то деякі з цих людей не отримали такої високої якості, як інші, і, можливо, не зможуть кваліфікуватися. Коли я роблю це, я переходжу до постійної моделі - я кажу, що якщо висота не дорівнює деякому перцентилю вимірюваних максимальних висот, то це не верхня частина. Деякі люди стрибають на вершину. Деякі люди просто переходять лінію і сідають.
Я міг би додати широту і довготу до датчика, і підходити до рівнянь вищого порядку, і, можливо, я міг би краще підходити і мати більше людей, можливо, навіть рівно 45% від загальної кількості людей, які намагаються це зробити.
Тож скажімо, наступний рік - рік "великого льодовика" або "без льодовика", оскільки якийсь вулкан справді перетворює альбедо землі. Якщо я візьму свою складну і вимогливу модель з цього року і застосую її до людей, які піднімаються в наступному році, модель матиме дивні результати. Можливо, всі "пройдуть" або навіть будуть занадто високими, щоб пройти. Можливо, ніхто взагалі не пройде, і він подумає, що насправді ніхто не завершив сходження. Особливо, коли модель складна, вона, як правило, недостатньо добре узагальнює. Він може точно відповідати цим навчальним даним цього року, але коли з’являються нові дані, він веде себе погано.
Обговорення:
Якщо ви обмежуєте складність моделі, тоді, як правило, ви можете мати кращі узагальнення без надмірної підгонки. Використання більш простих моделей, більш сформованих для урахування змін у реальному світі, як правило, дає кращі результати, всі інші рівні.
Тепер у вас є фіксована мережа топологія, тож ви говорите "мій кількість параметрів виправлений" - я не можу змінювати складність моделі. Дурниці. Виміряйте ентропію у вагах. Коли ентропія більша, це означає, що деякі коефіцієнти несуть значно більше "інформативності", ніж інші. Якщо у вас дуже низька ентропія, це означає, що в цілому коефіцієнти мають однаковий рівень "інформативності". Інформативність - це не обов'язково добре. В умовах демократії ви хочете, щоб усі люди були рівними, а такі речі, як Джордж Оруелл, "рівніші за інших" - це міра невдач системи. Якщо у вас немає вагомих причин, ви хочете, щоб ваги були дуже схожими один на одного.
Особиста примітка: замість того, щоб використовувати вуду чи евристику, я віддаю перевагу таким речам, як "критерії інформації", оскільки вони дозволяють мені отримати достовірні та послідовні результати. AIC , AICc та BIC - деякі загальні та корисні вихідні точки. Повторний аналіз для визначення стабільності рішення чи діапазону результатів інформаційних критеріїв є загальним підходом. Можна поглянути на встановлення стелі на ентропію у вагах.