Регресія на одиничному диску, починаючи з «рівномірно розташованих» зразків


9

Мені потрібно вирішити складну проблему регресії на одиничному диску. Оригінальне запитання привернуло кілька цікавих коментарів, але на жаль жодної відповіді. Тим часом я дізнався щось більше про цю проблему, тому спробую розділити початкову проблему на підпрограми та побачити, чи мені в цей час пощастить більше.

У мене 40 датчиків температури регулярно розташовані у вузькому кільці всередині диска: введіть тут опис зображення

Ці датчики з часом набувають температури. Однак, оскільки коливання часу набагато менше, ніж варіація простору, давайте спростимо проблему, ігноруючи мінливість часу, і припустимо, що кожен датчик дає мені лише середній час. Це означає, що у мене 40 зразків (по одному на кожен датчик) і у мене немає повторних зразків.

Я хотів би побудувати регресійну поверхню T=f(ρ,θ)+ϵз даних датчика. Регресія має дві цілі:

  1. Мені потрібно оцінити профіль середньої радіальної температури Tmean=g1(ρ)+ϵ. При лінійній регресії я вже оцінюю поверхню, яка є середньою температурою поверхні, тому мені потрібно лише інтегрувати свою поверхню стосовноθ, правда? Якщо я використовую поліноми для регресії, цей крок повинен бути шматочком пирога.
  2. Мені потрібно оцінити радіальний температурний профіль T95=g2(ρ)+ϵ, таким чином, що в кожному радіальному положенні, P(T(ρ)<T95(ρ))=.95.

З огляду на ці дві цілі, яку техніку я повинен використовувати для регресії на одиничному диску? Звичайно, для просторової регресії зазвичай використовують Гауссові процеси. Однак визначення хорошого ядра для одиничного диска не є тривіальним, тому я хотів би зробити прості речі та використовувати поліноми, якщо ви не відчуваєте, що це втрачаюча стратегія. Я читав про поліноми Зерніке . Поліноми Зерніке здаються підходящими для регресії на одиничному диску, оскільки вони періодичніθ.

Після вибору моделі мені потрібно вибрати процедуру оцінки. Оскільки це проблема просторової регресії, помилки в різних місцях повинні бути співвіднесені. Звичайні найменші квадрати припускають некорельовані помилки, тому я думаю, узагальнені найменші квадрати були б більш доречними. GLS здається порівняно поширеною статистичною технікою, враховуючи, що glsфункція є в стандартному розподілі R. Однак я ніколи не використовував GLS, і маю сумніви. Наприклад, як я оцінюю матрицю коваріації? Опрацьований приклад, навіть з кількома датчиками, був би чудовим.

PS Я вирішив використовувати поліноми Zernike і GLS, тому що мені здається, що тут логічно робити. Однак я не експерт, і якщо ви відчуваєте, що я йду в неправильному напрямку, сміливо використовуйте зовсім інший підхід.


На малюнку зображено двигун, який має ідеальну радіальну симетрію. Але чи пов’язане положення осей з якоюсь фізичною характеристикою двигуна, чи воно справді довільне? У другому випадку зміннаθматиме лише значення стосовно певного двигуна.
Ів

Відповіді:


2

Я думаю, ви на правильному шляху, думаючи про щось на зразок поліномів Зерніке. Як зазначається у відповіді jwimberly, це приклад системи ортогональних базових функцій на диску. Мені не знайомі поліноми Зерніке, але багато інших сімейств ортогональних функцій (включаючи функції Бесселя) виникають природним чином у класичній математичній фізиці як власні функції для певних часткових диференціальних рівнянь (під час написання цього тексту анімація у верхній частині цього зв’язку навіть показаний приклад вібраційної головки барабана).

На думку приходять два питання. По-перше, якщо все, що вам потрібно, це радіальний профіль (θусереднено), то скільки обмежень на просторовий зразок вам потрібно? По-друге, які типи змінності зустрічаються в просторово-часових даних?

Що стосується першого питання, то виникають дві проблеми. Завдяки полярним координатам область підтримки кожного датчика має тенденцію доr. Друге занепокоєння полягало б у можливості згладжування , по суті, неправильного вирівнювання датчиків відносно фази схеми (використовувати аналогію Фур’є / Бесселя). Зауважте, що згладжування, ймовірно, буде первинною невизначеністю у обмеженні пікових температур (тобтоT95).

З точки зору цього другого питання, мінливість даних насправді може допомогти у вирішенні будь-яких проблемних питань, по суті дозволяє дозволити будь-яке неправильне вирівнювання в середньому за різні вимірювання. (Якщо припустити відсутність систематичної упередженості ... але це було б проблемою для будь-якого методу, без, наприклад, фізичної моделі, щоб дати більше інформації).

Отже, однією з можливостей буде визначення ваших просторових ортогональних функцій виключно у місцях розташування датчика. Ці "емпіричні ортогональні функції" можна обчислити за допомогою PCA на вашій просторово-часовій матриці даних. (Можливо, ви могли б використовувати деяку вагу для врахування областей підтримки змінних датчиків, але, зважаючи на рівномірну полярну сітку та ціль радіальних середніх значень, це може не знадобитися.)

Зверніть увагу , що якщо є якесь - або дані фізичне моделювання , доступна для «очікуваних» варіацій температури, доступний на щільну сітці просторово - тимчасової розрахункової, то та ж сама процедура PCA може бути застосована до цієї інформації для отримання ортогональних функцій. (Це, як правило, називається " правильне ортогональне розкладання " в техніці, де воно використовується для скорочення моделі, наприклад, дорога модель обчислювальної динаміки рідини може бути відгонена для використання в подальшій проектній діяльності.)

Остаточний коментар, якби ви зважували дані датчика за площею підтримки (тобто розміром полярної комірки), це буде тип діагональної коваріації в рамках GLS . (Це стосуватиметься вашої проблеми прогнозування, хоча зважена PCA буде тісно пов'язана.)

Я сподіваюся, що це допомагає!

Оновлення: Ваша нова схема розподілу датчиків значно змінює мою думку. Якщо ви хочете оцінити температуру в інтер'єрі диска, вам знадобиться набагато більш інформативний поперед, ніж просто "набір ортогональних функцій на одиничному диску". Інформація в датчиках є занадто мало.

Якщо ви дійсно хочете оцінити зміни просторової температури на диску, єдиний розумний спосіб, який я бачу, - це трактувати проблему як один із даних щодо засвоєння даних . Тут вам потрібно, принаймні, обмежувати параметричну форму просторового розподілу, засновану на деяких міркуваннях, заснованих на фізиці (це може бути з симуляцій, або може бути з суміжних даних у системах зі схожою динамікою).

Я не знаю конкретного додатка, але якщо це що - щось на зразок цього , то я припустив би , що існує велика інженерна література , яку ви могли б спиратися , щоб вибрати відповідні попередні обмеження. (Для такого роду детальних знань про домен, мабуть, це не найкращий сайт StackExchange.)


Вражаюча відповідь! Потрібно трохи часу, щоб переварити його. Ви задаєте два запитання: я не впевнений, що я розумію перше («скільки обмежень щодо просторового шаблону вам потрібно?») Я подумав, що використання даних з усіх 40 датчиків буде краще, ніж просто усереднення по окружному напрямку і то підходить ... ти кажеш, це не обов’язково правда? Для другого ("які типи змінності трапляються в просторово-часових даних"), в наступні один-два дні я проаналізую перший двигун (у мене їх фактично 5! Але це буде темою майбутнє питання ...)
ctd

... ctd, я нормалізую дані, і я побачу, що я можу опублікувати на загальнодоступному сайті. Деякі просторові зразки та деякі часові ряди ... Я думаю, вони повинні дати вам уявлення про те, що ви запитуєте.
DeltaIV

1
Перше моє запитання: Якщо ваша кінцева мета полягає в тому, щоб по суті "передбачити результати датчиків для нового двигуна" (випливає з іншого вашого запитання), то чи справді вам потрібна якась інформація з "між датчиками" ?. Мій коментар по ступенчатости був прикладом того , чому ви б потребувати в такій інформації, наприклад , якщоT95не достовірно вимірюється на датчиках.
GeoMatt22

1
BTW, якщо це проблема дизайну, і є пов'язані імітації типу CFD, то це значно більше інформації, ніж передбачає поточний питання. (Наприклад, підхід до проблеми як засвоєння даних може використовувати різні підходи.)
GeoMatt22,

Ваша відповідь змушує мене подумати: замість регресії чи існує якийсь 2d еквівалент дискретної трансформації Фур'є, який можна було б зробити? Наприклад, приймаючи інтеграл точок даних в рази більше n-ї функції Бесселя (відповідним чином модифіковану), а потім отримуючи ортогональне розкладання? Побоювання тут полягають у тому, щоб 1) знайти відповідну дискретно-функціональну функцію, можливо, за тими ж лініями, що і ваша відповідь, і 2) чи буде це занадто чутливим до малої кількості точок відбору проб, і розкладання залежатиме від складніших умов вищого порядку .
jwimberley

2

Поліноми Zernlike не здаються поганим вибором, оскільки вони вже є r і θзалежність та ортогональність, приготовані. Однак, оскільки ви вивчаєте температуру, можливо більш правильним і більш відомим вибором будуть функції Бесселя . Вони з'являються при дослідженні теплового потоку в циліндричних об'єктах / системах координат, і тому існує ймовірність, що вони є фізично більш доречними. N-а функція Бесселя дала б радіальну залежність, пов'язану з відповідною тригонометричною функцією для полярної залежності; Ви можете знайти деталі у багатьох підручниках з фізики та PDE.


(+1) З'єднання рівняння полярних координат теплового рівня є хорошим. Ще одне, що, можливо, варто згадати, що для Гауссових процесів, які я знаю, як правило, на прямокутних сітках коваріаційна матриця є циркуляційною, і практично використовуються ПЗП. Тож функції Бесселя були б імовірним кандидатом на подібний підхід у полярній сітці.
GeoMatt22

Цікава пропозиція! Однак я вимірюю температуру в робочій рідині, а не в твердій частині двигуна. Таким чином, мене цікавить проблема конвекції на відміну від проблеми провідності. Функції Бесселя - це, безумовно, рішення рівняння теплопровідності (Фур'є), але я не думаю, що вони також є рішенням рівняння теплової конвекції, оскільки конвекція залежить від поля потоку рідини. У всякому разі, я міг би як мінімум випробувати їх проти Zernike. Що з GLS? Чи можете ви додати щось і в цій частині питання?
DeltaIV

@DeltaIV Я не надто знайомий із GLS, але одне питання - чому ви очікуєте, що помилки будуть корельовані в різних просторових точках? Я погоджуюся, що реальні коливання будуть співвідноситись між точками, але я думаю, що помилки (тобто невизначеність в показаннях датчика) будуть некорельованими. Можливо, коливання регресії вважаються помилками? Однак я розглядаю можливість додати щось про терміни штрафу. Незалежно від основи, яку ви використовуєте, у вас є лише обмежена кількість точок відбору зразків, і ви можете знайти деякі функції високого порядку, що відповідають функції Бесселя, тому слід віддавати перевагу умовам нижчого порядку.
jwimberley

@DeltaIV Що стосується коливань, які ввели би кореляції між просторовими точками: ваш об'єкт має отримати температурну карту, чи не так? Ви не хочете бачити, які коливання відбуваються? І чи може статистична модель їх навіть враховувати, оскільки коливання будуть зумовлені динамікою рідини та ускладнюватимуться в просторі та часі? (Чи пов’язано це з залежною від часу частиною вашого аналізу, яку ви залишили для простоти?)
jwimberley

створено галерею чату .
DeltaIV
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.