Так, це правильно. В основному, у вас є
fХ, Y( х , у) = fХ| Y( х | у) fY( у) ,
і, як ви сказали, ви можете взяти проби з щільності суглоба. Збір лише s із зразків приводить вас до вибірки з граничного розподілу.х
Це тому, що акт ігнорування є подібним до інтеграції над ним. Давайте зрозуміємо це на прикладі.у
Припустимо, = зріст матерів і = зріст дочки. Мета - отримати зразок щоб зрозуміти співвідношення висот дочок та їхніх матерів. (Я роблю припущення, що в сім'ї є лише одна дочка, і обмежую популяцію всім дочкам старше 18 років, щоб забезпечити повний ріст).Y ( X , Y )ХY( X, Y)
Ви виходите і отримуєте репрезентативний зразок
( х1, у1) , … , ( ХN, уN) .
Таким чином, для кожної матері ви маєте зріст їх дочки. Там повинна бути чіткий зв'язок між і . Тепер припустимо, що з вашого набору даних ви ігноруєте всі дані про дочок (скиньте ), то що у вас є? Ви повинні точно висота випадково вибрані матерів , які будуть черпає з маргінальних в .ХYYNХ