Нещодавно вивчивши завантажувальний тренажер, я придумав концептуальне питання, яке все ще мене спантеличує:
У вас населення, і ви хочете знати атрибут популяції, тобто , де я використовую для представлення населення. Наприклад, ця може бути середньою кількістю населення. Зазвичай ви не можете отримати всі дані від населення. Отже, ви намалюєте зразок розміру з сукупності. Припустимо, у вас є зразок iid для простоти. Тоді ви отримуєте свій оцінювач . Ви хочете використовувати щоб робити висновки про , тож ви хочете знати мінливість .
По-перше, існує справжній розподіл вибірки . Концептуально ви можете взяти багато зразків (кожен з них має розмір ) з сукупності. Кожен раз, коли у вас буде реалізація оскільки кожен раз ви матимете інший зразок. Зрештою, ви зможете відновити справжній розподіл . Гаразд, це принаймні концептуальний орієнтир для оцінки розподілу . Дозвольте повторити: кінцева мета полягає у використанні різних методів для оцінки або наближення справжнього розподілу .
Тепер тут виникає питання. Зазвичай у вас є лише один зразок який містить точок даних. Потім ви багато разів перепробовуєте цей зразок, і вам придумають розповсюдження завантаження . Моє запитання: наскільки близький цей розподіл завантажувальної машини до справжнього розподілу вибірки ? Чи існує спосіб її кількісної оцінки?