Репозитарії даних про охорону здоров'я в США рухаються до АГЕ у форматі років на п’ять років через вплив норм HIPAA щодо навмисного засліплення та маскування даних з особистих причин конфіденційності.
Враховуючи цей виклик тому, що було раніше (до HIPAA) досить масштабним рівнем елемента даних вимірювання, заснованого на різниці між датою народження та датою смерті, нам може знадобитися переглянути AGE як змінну шкали, яка може бути параметрично описані взагалі в наборах даних про охорону здоров’я, на користь моделей, які описують ВІР непараметрично, як порядковий рівень вимірювання. Я знаю, що це може здатися "зверху" багатьом фракціям у спільноті біомедичної інформатики, але ця ідея може мати певну заслугу в плані "інтерпретації", як описано в коментарях вище.
Що з усією аналітичною потужністю, яка доступна для непараметричних підходів? Так, це правда, що кожен з нас майже повсюдно спробує застосувати методи GLM (загальна лінійна модель) до змінної, яка представляє нам себе в дистрибутивах, які ведуть себе так, як це робить AGE.
При цьому форму цього розподілу та те, як ця форма визначається за рахунок ефектів багаторазової взаємодії на багатовимірні центроїди та підгрупи центроїдів, що присутні в розподілі, слід враховувати. Що робити з цими дуже складними наборами даних?
Коли елемент даних не відповідає "припущенням моделі", ми прогресивно скануємо (я сказав поперек, не вниз; ми повинні бути рівними можливостями роботодавців методу; кожен інструмент надходить із заводу з формою, яка відповідає правилам функцій) список інших можливих моделей, щоб знайти ті, які "не провалюють" тести припущень.
У нинішньому форматі у наборах даних про охорону здоров’я нам дійсно потрібно (як спільнота візуалізації даних) розробити більш стандартну модель поводження з ВІЛ за п'ятирічні кроки (5YI). Я голосую за візуалізацію даних AGE (з огляду на новий формат 5YI) - використовувати гістограми та графіки вікон та вусів. Так, це означає медіану. (Каламбур не призначений!)
Іноді малюнок дійсно коштує тисячі слів, а абстракт - це підсумок тисячі слів. Сюжет коробки та вусів показує "форму" розподілу як змістовне символічне зображення гістограми майже на знаковому рівні роздільної здатності. Порівнюючи розподіл приросту п’ятирічного віку, показуючи графіки "рядом" з вікном та вусами, де можна миттєво візуально порівнювати візерунки від 75-го до 50-го (медіана) до нижнього 25-го доля, створить елегантний "універсальний стандарт" для порівняння вікових груп світ. Для тих із нас, хто продовжує насолоджуватися хвилюванням подання даних за допомогою текстової механіки табличного відображення, діаграма "стебло та лист" також може бути корисною, коли використовується як анімований елемент візуальної графіки в "блискучій лінії"
ВЗАГАЛІСТЬ ДОСЛІННЯ Це потрібно додатково вивчити за допомогою більш потужних обчислювальних алгоритмів, які зараз доступні.