Існують дві різні типові ситуації для подібних проблем:
i) ви хочете генерувати вибірку із заданого розподілу, чиї характеристики популяції відповідають вказаним (але через зміну вибірки, вибіркові характеристики точно не відповідають).
ii) ви хочете генерувати вибірку, характеристики вибірки якої відповідають вказаним (але через обмеження точно збігання величин вибірки до заданого набору значень насправді не виходять із потрібного розподілу).
Ви хочете другий випадок - але ви отримуєте його, дотримуючись того ж підходу, що і перший випадок, з додатковим кроком стандартизації.
Отже, для багатоваріантних нормалів це може бути зроблено досить просто:
У першому випадку ви можете використати випадкові нормали без структури популяції (наприклад, стандартний нормальний стандарт, у якого очікування 0 та матриця коваріації ідентичності), а потім накласти це - перетворити, щоб отримати матрицю коваріації та означає, що ви хочете. Якщо і Σ - це середнє значення сукупності, а вам потрібна коваріація, а z є стандартним нормальним, ви обчислюєте y = L z + μ , для деяких L, де L L ' = Σ (наприклад, відповідний L можна отримати при розкладанні Холеського). Тоді y має бажані популяційні характеристики.μΣzy=Lz+μLLL′=ΣLy
З другим, ви повинні спочатку перетворити свої випадкові нормали, щоб видалити навіть випадкову зміну від нульової середньої та ідентичності коваріації (зробити вибірку середньою нулевою та коваріантність вибірки ), а потім продовжити, як і раніше. Але той початковий крок усунення відхилення вибірки від точного середнього значення 0 , дисперсія IIn0I заважає розподілу. (У невеликих пробах це може бути досить важко.)
Це можна зробити, віднявши середнє вибіркове значення ( z ∗ = z - ˉ z ) і обчисливши розклад Холеського z ∗ . Якщо L ∗ - лівий коефіцієнт Холеського, то z ( 0 ) = ( L ∗ ) - 1 z ∗ повинен мати середнє значення вибірки 0 та коваріацію вибірки ідентичності. Потім можна обчислити y = L z ( 0 ) + μzz∗=z−z¯z∗L∗z(0)=(L∗)−1z∗y=Lz(0)+μі мати вибірку з бажаними моментами вибірки. (Залежно від того, як визначено кількість вашої вибірки, може бути додаткова невелика скрипка, пов'язана з множенням / діленням на такі фактори, як , але визначити цю потребу досить просто.)n−1n−−−√