Чи є краща назва, ніж "середнє значення інтеграла"?


12

Я тестую датчики положення дросельних дроселів (TPS), що продається моїм бізнесом, і я друкую графік реакції напруги на обертання дроселя. TPS - датчик обертання з діапазоном 90 °, і вихід є як потенціометр з повним відкритим значенням 5 В (або вхідним значенням датчика), а початкове відкриття - деяким значенням від 0 до 0,5 В. Я побудував тестовий стенд з контролером PIC32, щоб зробити вимірювання напруги кожні 0,75 °, і чорна лінія з'єднує ці вимірювання.

Один з моїх продуктів має тенденцію робити локалізовані відхилення амплітуди від (і під) ідеальної лінії. Це питання стосується мого алгоритму кількісної оцінки цих локалізованих "провалів"; що таке добре ім’я чи опис для процесу вимірювання провалів? (Повне пояснення випливає). На малюнку нижче, опускання відбувається в лівій третині сюжету і є незначним випадком, чи пройду я цю частину, чи провалить її:

Друк із підозрюваної частини

Тож я створив датчик занурення ( stackoverflow qa про алгоритм ), щоб оцінити своє відчуття кишечника. Спочатку я думав, що вимірюю "площу". Цей графік заснований на роздруківці вище та моїй спробі пояснити алгоритм графічно. Існує спринцювання тривалістю 13 зразків між 17 і 31:

Вибірені дані, показані зі збільшенням "опускання"

Дані тесту надходять у масив, і я роблю інший масив для "підйому" від однієї точки даних до другої, яку я називаю . Я використовую бібліотеку, щоб отримати середнє та стандартне відхилення для .d e l t a sdeltasdeltas

Аналіз масиву представлений на графіку нижче, де ухил видаляється з вищевказаного графіка. Спочатку я вважав це "нормалізацією" або "об'єднанням" даних, оскільки вісь x - це рівні кроки, і я зараз працюю виключно з підйомом між точками даних. Досліджуючи це питання, я нагадав, що це похідна, вихідних даних.d ydeltasdydx

Аналіз похідної ...?

Я проходжу щоб знайти послідовності, де є 5 або більше суміжних негативних значень. Сині смуги - це ряд точок даних, які нижче середнього рівня всіх . Значення блакитних смуг:d e l t a sdeltasdeltas

0.7+1.2+1.3+1.4+1.8+2.5+2.9+3.0+2.5+2.0+1.5+1.0+1.2

Вони складають , що представляє область (або інтеграл). Перша моя думка - «Я щойно інтегрував похідну», що має означати, що я отримую назад вихідні дані, хоча я впевнений, що для цього є термін.23

Зелена лінія - це середнє значення цих "нижче середніх значень", знайдене через ділення площі на довжину занурення:

23÷13=1.77

Під час тестування 100+ деталей я вирішив, що спринцювання із середньою зеленою лінією менше є прийнятними. Стандартне відхилення, обчислене в усьому наборі даних, не було достатньо суворим тестом для цих провалів, оскільки, не маючи достатньої загальної площі, вони все ще потрапляли в межу, встановлену для хороших частин. Я спостережно вибрав стандартне відхилення як максимальне, що я дозволив би.3.02.63.0

Встановлення відсіку для стандартного відхилення досить чітке для відмови цієї частини, то було б настільки суворим, щоб вийти з ладу частини, які в іншому випадку, здається, мають великий сюжет. У мене також є детектор шипа, який виходить з ладу, якщо є .|deltasavg|>avg+stddev

Минуло майже 20 років з тих пір Calc 1, тому , будь ласка , йти легко на мене, але це відчуває себе дуже схоже , коли професор використовував обчислення і водотоннажність рівняння пояснити , як в гонках, конкурент з меншим прискоренням , який підтримує більш високу швидкість кутову може побити інший У конкурента, що має більше прискорення до наступного повороту: швидше проходить попередній поворот, тим більша початкова швидкість означає, що площа під його швидкістю (переміщення) більша.

Щоб перевести це на моє запитання, я відчуваю, що моя зелена лінія була б як прискорення, друга похідна від вихідних даних.

Я відвідав вікіпедію, щоб перечитати основи обчислення та визначення похідних та інтегралів , дізнався правильний термін додавання площі під кривою за допомогою дискретних вимірювань як числової інтеграції . Набагато більше гугле в середньому від інтеграла, і я веду до теми нелінійності та цифрової обробки сигналів. Усереднення інтегралу здається популярним показником для кількісного визначення даних .

Чи є термін середнього інтегралу? ( , зелена лінія)? 1.77
... або для процесу його використання для оцінки даних?


Я думаю, що "середній занурення" досить добре. Він не має розмірів прискорення, тому це, звичайно, нічого спільного.
ShreevatsaR

І я вдячний за будь-які спостереження чи коментарі до цієї теми в цілому. Мене трохи турбує те, як це вимірювання «відчуття кишки» не краще виражене математично.
Кріс К

Чи можете ви, можливо, додати всі точки даних, які ви використовували для побудови ідеальної лінії, або додати трохи більше інформації про те, як обчислюється пунктирна червона лінія, щоб виправдати сині смуги "дельтами, що нижче середнього за всіх точки даних "? Якщо це морально середня відстань від середнього, то для цього має бути назва стилю прискорення, замінивши курсову диференціацію на взяття середнього.

1
Перенесено з Math.SE на запит ОП: meta.stats.stackexchange.com/questions/1845/…
Віллі Вонг

1
Я можу додати слово "локальний", щоб зрозуміти, що крок 1 існує - я погоджуюся з @Glen_b (іншим Гленом - привіт!), Що це важливо. Тож я б попередньо запропонував «місцевий середній дефект», де я просто поєднав «відхилення від ідеалу» до «дефекту». Здається, підходить.
Глен Уілер

Відповіді:


3

Перш за все, це чудовий опис вашого проекту та проблеми. І я великий прихильник вашої домашньої системи вимірювань, яка надзвичайно крута ... так чому ж на землі має значення те, що ви називаєте "усередненням інтегралів"?

x[n]>αSD(x[1:n1])=>x[n] is outlier
x[n]nthSD(x[1:n1])1st(n1)thαh
x[n]>αSD(x[nh1:n1])=>x[n] is outlier

x[n]

Існують також інші правила, які ви можете розглянути для класифікації пристрою як несправного:

  • якщо будь-яке відхилення (дельта) більше деякого кратного SD всіх дельт
  • якщо квадратна сума відхилень більша за певний поріг
  • якщо співвідношення суми позитивної та негативної дельти не є приблизно рівним (що може бути корисно, якщо ви віддаєте перевагу менші помилки в обох напрямках, а не сильне зміщення в одному напрямку)

Звичайно, ви можете знайти більше правил і об'єднати їх за допомогою булевої логіки, але я думаю, що ви можете дуже далеко досягти цих трьох.

І останнє, але не менш важливо, щойно ви встановите його, вам потрібно буде протестувати класифікатор (класифікатор - це система / модель, яка відображає вхід до класу, у вашому випадку - дані кожного пристрою, або "добре", або " несправний "). Створіть тестовий набір, позначивши продуктивність кожного пристрою вручну. Потім подивіться на ROC , який в основному повідомляє про компенсацію між кількістю пристроїв, які ваша система правильно вибирає із повернених, щодо кількості несправних пристроїв.


Я вважаю, що "чому це важливо", це функція вашого власного імені користувача. :) Чому? Цією ж причиною є клубовий гребінь: нам потрібні слова, щоб виразно кількісно оцінити все унікальне в житті. Імхо, цей QA - приклад того, наскільки обмежена лексика в статистиці. Нам потрібно поєднувати заплутані чи суперечливі дескриптори того, що "на око" так просто.
Кріс К

Хе-х, добре помічений сер! :) Якщо я пропустив будь-які починання у країну креативного брендингу, це було лише тому, що я змушений був підтримувати винахідливість та відданість ваших зусиль та ідей, а не придумувати марні етикетки. Оскільки ви наполягаєте на називанні середнього інтеграла, будьте обережні, що те, що ви вважаєте "середнім інтегралом", є простим середнім значенням ваших дельт. І як такі, ваші люди, що втратили життя, - це просто "відхилення від середнього", або, можливо, відхилення від середнього значення. Я не бачу переваги мислення в інтегралах, якщо у вас не вистачає точок вибірки.
значуще -
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.