Які способи показати два аналітичні методи рівнозначні?


11

У мене є два різні аналітичні методи, які дозволяють вимірювати концентрацію певної молекули в матриці (наприклад, вимірювати кількість солі у воді)

Два способи різні, і в кожного є своя помилка. Які існують способи показати два методи, рівнозначні (чи ні).

Я думаю, що побудувати графік результатів з ряду вибірок, виміряних обома методами на графіку розсіювання, є хорошим першим кроком, але чи є хороші статистичні методи?


Чи можете ви дати детальнішу інформацію у своєму запитанні? Я не розумію, що таке "концентрація певної молекули в матриці".
Робін Жирард

2
@robin: "матриця" в цьому контексті є стандартною термінологією з аналітичної хімії; Це стосується середовища, на якому можуть бути знайдені суб'єкти, що підлягають аналізу ("аналіти"). Наприклад, якщо ви аналізуєте концентрацію свинцю у водопровідній воді, свинець - це аналіт, а вода - матриця.
JM не є статистиком

Відповіді:


13

Простий кореляційний підхід - не правильний спосіб аналізу результатів досліджень порівняння методів. Є (принаймні) дві настійно рекомендовані книги на цю тему, на які я посилався в кінці (1,2). Якщо коротко сказано, при порівнянні методів вимірювання ми зазвичай очікуємо, що (a) наші висновки не повинні залежати від конкретного зразка, який використовується для порівняння, і (b) похибки вимірювання, пов'язані з конкретним вимірювальним приладом, слід враховувати. Це виключає будь-який метод, заснований на кореляціях, і ми звернемо нашу увагу на дисперсійні компоненти або моделі змішаних ефектів, які дозволяють відобразити систематичний ефект елемента (тут позиція виступає для окремого або вибірки, на якій збираються дані), що є результатом (а).

X1X2(X1+X2)/2X1X2, і його інтерпретація близька до графіку встановлених проти залишкових значень, що використовуються в лінійній регресії. Тоді,

  • якщо різниця є постійною ( постійне зміщення ), можна обчислити ліміт узгодження (див. (3))
  • якщо різниця не є постійною в межах діапазону вимірювання, ви можете помістити лінійну регресійну модель між двома методами (виберіть той, який потрібно в якості прогноктора)
  • якщо дисперсія відмінностей не є постійною, спробуйте знайти відповідне перетворення, яке робить співвідношення лінійним з постійною дисперсією

Інші деталі можна знайти в (2), главі 4.

Список літератури

  1. Данн, G (2004). Проектування та аналіз досліджень надійності . Арнольд. Дивіться огляд у Міжнародному журналі епідеміології .
  2. Карстенсен, Б (2010). Порівнюючи клінічні методи вимірювання . Вілі. Див. Супровідний веб-сайт , включаючи код R.
  3. Оригінальна стаття від Бланда та Альтмана, Статистичні методи оцінки згоди між двома методами клінічного вимірювання .
  4. Карстенсен, Б (2004). Порівняння та прогнозування між кількома методами вимірювання . Біостатистика , 5 (3) , 399–413.

Ви не хотіли б пояснити, що ви маєте на увазі під «а) наші висновки не повинні залежати від конкретного зразка, який використовується для порівняння»? У мене виникають проблеми через неоднозначність "вибірки" в цьому контексті: чи означає це "статистична вибірка" (сукупність даних, які, як передбачається, представляють собою процес чи населення), або "екологічна вибірка" (трохи води, ґрунту, повітря, або тканини, як правило). З будь-яким значенням я не можу повністю зробити логічну лінію до вашого висновку, що це "виключає будь-який метод, заснований на кореляціях".
whuber

@whuber Добре, я маю на увазі збір спостережуваних даних (наприклад, концентрація глюкози), які в ідеалі повинні бути репрезентативними для ймовірного діапазону того, що вимірюється. Покладання на кореляцію може бути оманливим, оскільки це залежить від вибіркових одиниць (наприклад, пацієнтів у стаціонарі): ми можемо отримати більш високу кореляцію, лише отримавши одне або більше екстремальних вимірювань в будь-якій шкалі, хоча співвідношення між двома методами все одно однакове . Отже, ідея полягає в тому, що розподіл міри, що цікавить, не повинен впливати на наш висновок про порівнянність методів. (...)
chl

@whuber (...) Що ми хочемо оцінити, це узгодження поза даними , а не співвідношення в даних (я цитую Carstensen 2010 p. 8-9).
chl

Дякую; що добре уточнює вашу позицію. Це по суті вправа калібрування, за винятком того, що у нас, здається, немає еталонного стандарту для порівняння; ми просто припускаємо, що обрані експериментатором фізичні зразки охоплюють деякий діапазон справжніх концентрацій. Таким чином, як ви пишете, кореляція сама по собі не обов'язково є корисною мірою згоди між двома методами. Як правило, особливо для хімічних аналізів, відома справжня концентрація (оскільки експериментатор ввів відому кількість речовини в матрицю).
whuber

@whuber Правильно. За відсутності золотого стандарту ми просто зацікавлені в тому, наскільки два методи дають "порівнянні" результати, отже, ідея спиратися на так звані межі узгодження. Хоча справжня міра може бути відома заздалегідь, кожен вимірювальний прилад має власну помилку вимірювання - принаймні для тих, з якими я мав справу в біомедичній (наприклад, концентрація глюкози в крові) та нейропсихологічній (наприклад, рівень депресії).
chl

2

Якщо у вас немає можливості пізнати справжню концентрацію, найпростіший підхід був би співвідношенням. Крок поза цим може бути простим регресом, що передбачає результат за методом 2, використовуючи метод 1 (або навпаки). Якщо методи однакові, перехоплення повинно бути 0; якщо перехоплення більше або менше 0, воно вказувало б на зміщення одного методу щодо іншого. Нестандартний нахил повинен бути близько 1, якщо методи в середньому дають однакові результати (після контролю за зміщенням вгору або вниз в перехопленні). Помилка нестандартного схилу може слугувати індексом того, наскільки ці два методи узгоджуються.

Мені здається, що тут складно зі статистичними методами, які ви прагнете підтвердити те, що зазвичай ставиться як нульова гіпотеза, тобто відсутність відмінностей між методами. Це не смертельний удар для використання статистичних методів до тих пір, поки вам не потрібне значення ap, і ви зможете кількісно оцінити, що ви маєте на увазі під "еквівалентом", і ви можете вирішити, скільки відхилень можуть мати два методи один від одного, перш ніж ви більше не будете вважати їх рівнозначними. У регресійному підході, який я детально описав вище, ви можете вважати методи еквівалентними, якщо довірчий інтервал навколо нахилу включає 1 і CI навколо перехоплення 0.


У хіміометрії реакції інструменту часто нелінійні та гетероскедастичні. Як мінімум, що накладає певну обережність при проведенні та інтерпретації регресії.
whuber

1

Я згоден з @drnexus. Крім того, я можу порекомендувати тест Моргана-Пітмена на рівність дисперсій двох методів. Це скаже вам, якщо один метод має більше дисперсії, ніж інший. Це саме по собі може бути не поганим, оскільки, мабуть, два тести мають різні компроміси з відхиленням у відхиленнях (наприклад, один тест завжди може говорити 50% (упереджений, але відхилення), а інший є неупередженим, але дуже галасливим). Деякі знання домену тут можуть бути корисними при визначенні того, який обсяг ви бажаєте від свого методу. Звичайно, як зазначають інші, перевагу матиме «золотий стандарт».


1

Досить старе питання, але як воно з’явилося сьогодні знову:

Загальне ключове слово - "валідація в аналітичній хімії", і як таке воно тут трохи поза темою (але оскільки тут немає сайту хімії (поки: http://area51.stackexchange.com/proposals/4964/chemistry , I) здогадуємось, ми можемо залишити його на даний момент)

Для цього існують деякі стандартні процедури в аналітичній хімії.

Книги:

  • Функ та ін. al: Забезпечення якості в аналітичній хімії, Wiley-VCH.

  • Kromidas (Hrsg.): Handbuch Validierung in der Analytik, Wiley-VCH
    (я не знаю, чи є англійська версія, і у мене її немає (поки що). Але в змісті перелічено перевірку багатовимірної калібрування.)

Про це теж має сказати IUPAC:

  • Данзер, К. та Керрі, Л.А .: Настанови щодо калібрування в аналітичній хімії. Частина I. Основи та однокомпонентне калібрування, Чиста та прикладна хімія, IUPAC, 1998, 4, 993-1014

  • Данзер, К. і Отто, М. і Керрі, Л.А .: Настанови щодо калібрування в аналітичній хімії. Частина 2: Багатокомпонентне калібрування чистої та прикладної хімії, 2004, 76, 1215-1225


0

Ваше використання фрази "аналітичні методи" мене трохи бентежить. Я припускаю, що під "аналітичними методами" ви маєте на увазі певну модель / стратегію оцінки.

Взагалі кажучи, існує два типи показників, які ви можете використовувати для вибору між оцінками.

Вибіркові показники

  • Коефіцієнт ймовірності / тест Вальда / Тест
  • R 2
  • Тарифи звернення у вибірці (відсоток правильних прогнозів для вибіркових даних)
  • (Багато інших показників залежно від контексту моделі / оцінки)

Позамобільні показники

  • Позавимірювані тарифи звернення (відсоток правильних прогнозів для вибіркових даних)

Якщо оцінки еквівалентні, вони б на цих показниках працювали однаково добре. Ви також можете побачити, якщо оцінки статистично не відрізняються одна від одної (як тест на дві вибірки рівності засобів), але методологія цього залежатиме від специфіки моделі та методу.


Вибачте, я мав на увазі метод аналітичного вимірювання. Я переформулював це питання.
ПавлоГюрлейюк

У цьому випадку я думаю, що ви хочете зробити двопробний тест рівності для засобів / пропорцій.

2
Невже тест засобів / пропорцій не дасть точну оцінку того, чи дали два методи однакову середню відповідь для заданого набору відповідей? Чи не міг би такий підхід дати результат "рівний", навіть якщо два способи були фактично негативно пов'язані один з одним?
russellpierce

Це хороший момент.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.