Які мінімальні критерії відповідності рекомендовані для надійного підбору демографічних показників пацієнтів?


30

Якщо співставляють пацієнтів на основі демографічних даних, чи є якісь рекомендації щодо того, які поля повинні відповідати, щоб пацієнт був "тим самим пацієнтом"?

Я знаю, що алгоритми будуть різними для різних реалізацій, мені просто цікаво, чи є якісь найкращі практики чи рекомендації навколо цього процесу.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

тощо?


4
Можливо, відповідь на це питання також може змінюватися залежно від конкретної країни чи навіть від етнічних та культурних міркувань. Наприклад, ім’я особи може не бути хорошим ідентифікатором пацієнта для австралійських аборигенів (або їм слід надати меншу "вагу" у їхньому випадку), оскільки вони можуть змінити ім'я з часом. Австралійські аборигени, які носять те саме ім’я, як померлий, відмовляються, тому що вони вважають, що дуже погано носити те саме ім'я того, хто помер. Щось подібне відбувається і в інших культурах, а ім’я загиблих - табу. посилання

4
Або інший приклад з поки що не опублікованого дослідження: у філіппінських іммігрантів до США десять найпоширеніших прізвищ складають близько 6% всіх людей. В'єтнамські іммігранти складають ~ 60%. Імена є значно кращим ідентифікатором у філіппінських, ніж в’єтнамські. Я обов'язково опублікую це дослідження, коли воно буде доступне.

Просто для уточнення: чи є основною метою відповідати два набори записів?

Намагаючись співставити записи, не забудьте розрізнити силу матчу ("Боб" дуже схожий на "Боб") порівняно з кількістю можливих матчів (Бобс багато). Якщо два записи мають одне ім’я, а інших записів із цим іменем немає , це, мабуть, та сама особа, навіть якщо адреси відрізняються. Якщо, звичайно, у вас є великий корпус.
Йон усіх торгів

Відповіді:


20

Там є цей чудовий нарис (іспанською, вибачте), написаний Пабло Пацосом, інженером з Уругваю, який працює над ІТ в галузі охорони здоров'я з 2006 року і зробив великий внесок у цю сферу, в якій він описує алгоритм для цього.

Ви можете запустити статтю через перекладача, але суть її полягає в тому, що основна інформація, яка визначає особу людини, - це їх імена та прізвища (як від батька та матері), стать та дата народження. Цікаво, що він спеціально виключає ідентифікаційні номери, наприклад, SSN, зі своїх алгоритмів відповідності ідентичності, оскільки "будь-який тип ідентифікатора НЕ є частиною його ідентичності" (я думаю, цей пункт може бути дискусійним, хоча). Крім того, він виключає такі атрибути, як адреса вулиці, номери телефонів тощо, оскільки вони насправді не пов'язані з особою когось, вони не пов'язані з "ким хто насправді є".

Крім того, він присвоює різні "ваги" кожному з попередніх атрибутів, наприклад, таким:

  • Ім'я: 17,5%
  • Прізвище: 17,5%
  • Прізвище (батько): 17,5%
  • Прізвище (мати): 17,5%
  • Стать: 10%
  • DOB: 20%

Із відповідниками, знайденими у кожному з цих атрибутів, він описує методологію отримання складеного "індексу узгодження відповідності", з яким можна порівняти записи. Також "часткові" збіги на атрибутах імен можливі за допомогою таких алгоритмів, як відстань Левенштейна .

Добре читайте, ІМО. Вибачте, це іспанською мовою, але я сподіваюся, що мені вдалося передати її основні ідеї.


2
це чудово, дякую. +1 також для згадування відстані, оскільки помилки друку досить поширені, особливо в громадах з високою різноманітністю культурного походження, як це часто буває в Північній Америці. Однак, більшість випадків, коли мені доводиться виконувати відповідність області можливих значень, є досить обмеженими. Отже, у цих випадках будь-який надійний критерій (наприклад, номери медичного страхування), що повертає один посилання в базу даних, буде достатнім, якщо повернуто кілька записів, я схильний або запитувати користувача (якщо є), або фільтрувати за додатковим критерієм.

(... продовження) Зауважте, що ці випадки добре стосуються місцевого встановлення ЕМР у клініці чи лікарні, або RIS до радіологічного відділення. У цих випадках замовник або зареєстрований у клініці чи лікарні, або ні. Однак у випадках MPI - це зовсім нова гра з м'ячем.

13

Не існує єдиного магічного алгоритму відповідності пацієнтів, і я сумніваюся, що коли-небудь буде.

Для початку існують регіональні дисперсії. Як зазначав MMattoli, те, що добре працює в міській лікарні США, ймовірно, не вписується в сільську австралійську клініку, яка лікує аборигени.

Також окремі сайти мають різні погляди на відмовостійкість. Якби ви відповідали лише тоді, коли були абсолютно впевнені , отримали б багато пропущених матчів. Це викликає дублювання записів пацієнтів, що створює цілий інший набір проблем. Більшість сайтів будуть готові влаштуватись на досить впевнені , але наскільки впевнені досить впевнені? Запитайте 10 людей, і ви отримаєте 12 відповідей.

Тому алгоритм "найкращого" буде налаштований, так що ваші клієнти можуть налаштувати його відповідно до своїх потреб.

Розглядаючи матч, різні поля пропонують різну ступінь впевненості.

Специфічні для охорони здоров’я ідентифікатори пропонують найбільшу впевненість, оскільки їх цільове призначення - однозначна ідентифікація людини в системі охорони здоров'я. Лікарні зазвичай беруть болі, щоб переконатися, що вони не дублюються.

Приклади:

  • Національний ідентифікатор здоров'я (наприклад, номер NHS Великобританії)
  • Номер лікарської картки, призначений лікарнями.

Інші ідентифікатори пацієнтів можуть також забезпечити високу впевненість, залежно від системи. Наприклад, військовий посвідчення, ймовірно, є дуже актуальним у військовому госпіталі.

Приклади:

  • Військовий посвідчення
  • Ідентифікаційний код страхування
  • Номер соціального страхування (У США номер соціального страхування, як правило, не вважається збігом високої довіри через невпинну страховку.)

За відсутності унікальних ідентифікаторів потрібно вдаватися до демографічної інформації. Нераціонально поєднуватись на будь-якому одному полі, але чим більше збігається демографічне поле, тим впевненіше зустрічається.

Речі про людину, які часто не змінюються, корисні для узгодження:

  • Ім'я
  • Стать
  • Дата народження

Але в матчі можна розглянути ще більш корисну інформацію, щоб підвищити впевненість:

  • Адреса
  • Номер телефону
  • Адреса електронної пошти

3
SSN також має дуже суворе обмеження, наприклад, у Канаді забороняється навіть просити його, якщо ви не роботодавець чи банк (можливо, ще якийсь, я не юрист). В інших місцях, таких як Китай, вони користуються ним майже для чого завгодно, навіть для придбання квитків на поїзди під час святкового руху.

Зміни імен поширені, якщо ви жінка. А двоє людей часто мають одне ім’я і навіть живуть у тому самому місці (наприклад, батько з сином, прізвиськом на ім'я).
HLGEM

@HLGEM: Цілком правильно, тому жодне демографічне поле не слід використовувати для відповідності. Але коли людям доводиться вдаватися до цього, більш статичні поля (які, тим не менш, іноді змінюються) є більш надійними, ніж альтернатива. Але це не робить їх гарними.
Лінн

7

Також варто перевірити попередні прізвища, оскільки вони часто змінюються.


+1 "часто" - заниження. :) Це, безумовно, може бути у випадку з пацієнтами, які не можуть бути ідентифікованими або безіменними, новонародженими, неправильно ідентифікованими тощо. Імена є складнішими, але ще більш значущими в середовищі з великою кількістю транзакцій.

4

Крім очевидних комбінацій наступних трьох, наведених у вашому запитанні

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

Я б подумав додати phone number (Home and/or Cell)до списку. У наші дні це досить поширене явище, і кожен матиме унікальний номер, і навіть якщо люди раз змінюють свої номери телефонів, більшість людей запам'ятовують більш старі номери телефонів, тому це може стати в нагоді.

Ми виявили, що адреса часто страждає від численних написань та безлічі способів відображення, особливо в таких країнах, як Індія, де люди використовують місцеву мову, а програмне забезпечення для управління пацієнтами "досі" використовує англійську мову.


3

Стать у записах, здається, часто походить від Імені. Я помітив, що для іноземців зростає різниця у статі, коли ми не можемо отримати гендерну назву від імені.

У Німеччині у нас є додаткові розбіжності з назвами, що містять "Umlaute" на зразок "äöü", які іноді замінюються на "ae oe ue".


1

Моя думка в порядку, як нижче 1). SSN, прізвище та перші 5 символів імені 2). SSN, дата народження та перші 5 символів імені 3). SSN, дата народження та прізвище 4). SSN, стать, дата народження 5). Прізвище, перші 5 символів імені, міста та поштового індексу


1

Це справді жорстка проблема в США. Імена не є унікальними і часто змінюються протягом життя людини або подаються по-різному (наприклад, Роб проти Роберта), тому їх ніколи не можна використовувати для ідентифікації пацієнта, за винятком спільної з деякою більш достовірною інформацією. Номер медичного страхування та постачальник послуг змінюються набагато частіше і можуть бути однаковими для кількох членів сім'ї. SSN нібито унікальний, але навколо нього є шахрайство. Те саме з ліцензійним номером водія, який, звичайно, не матимуть усі.

Особисто я б почав із номера страхового полісу, дати народження та імені, а потім ssn та дати народження та імені. Я би перевірив адресу і телефон, щоб дати мені додаткові впевненості, коли вони відповідають, але не мають великої ваги, якщо вони не відповідають. Крім того, я б використовував групу крові як фактор виключення, якщо це відомо (і всі ми знаємо, що госпітальні вампіри братимуть зразки крові), оскільки це не змінюється. Збіг імен повинен був бути нечітким відповідним через проблему із зміною імені. Інші речі, як правило, повинні шукати точну відповідність спочатку нечіткої відповідності темі, якщо впевненість у назві дійсно висока (могла бути помилка друку в SSN).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.