У мене є набір даних, який містить ~ 7500 аналізів крові від ~ 2500 людей. Я намагаюся з’ясувати, чи збільшується або зменшується мінливість в аналізі крові з часом між двома тестами. Наприклад - я беру кров для базової проби, а потім негайно беру другий зразок. Через півроку малюю ще один зразок. Можна очікувати, що різниця між базовою лінією та негайними повторними тестами буде меншою, ніж різниця між базовою лінією та шестимісячним тестом.
Кожна точка на графіку нижче відображає різницю між двома тестами. X - кількість днів між двома тестами; Y - величина різниці між двома тестами. Як бачите, тести не розподілені рівномірно по X - дослідження не було розроблене для вирішення цього питання. Оскільки точки настільки сильно розміщені в середньому, я включив 95% (сині) та 99% (червоні) квантильні лінії на основі вікон на 28 днів. Вони, очевидно, тягнуться навколо більш екстремальних моментів, але ви розумієте.
alt text http://a.imageshack.us/img175/6595/diffsbydays.png
Мені здається, що мінливість досить стабільна. Якщо що-небудь, то це вище, коли тест повторюється протягом короткого періоду - це жахливо протипоказано. Як я можу вирішити це систематично, враховуючи різну n у кожний момент часу (та деякі періоди, у яких взагалі відсутні тести)? Ваші ідеї дуже вдячні.
Для довідки, це розподіл кількості днів між тестом та повторним тестуванням:
alt text http://a.imageshack.us/img697/6572/testsateachtimepoint.png