Як представити використання кВт · год за роком проти середньої температури?


9

Просто заради задоволення, я хочу скласти графік споживання електроенергії щомісяця в році за рік. Однак я хочу включити деяку посилання на щомісячну температуру, щоб я міг визначити, чи покращується, погіршується чи погіршується мій дім чи погіршується стан споживання кВт / год.

Дані, з якими я працюю:

+----------+--------+-----------+----------------+----------+-----------+------------+
|  Month   | # Days | kWh Usage | Daily kWh Avg. | Avg. Low | Avg. High | Avg. Temp. |
+----------+--------+-----------+----------------+----------+-----------+------------+
| Mar 2015 |     32 |      1048 |             33 |       40 |        60 |         50 |
| Feb 2015 |     29 |      1156 |             40 |       32 |        54 |         43 |
| Jan 2015 |     33 |      1143 |             35 |       38 |        57 |         47 |
| Dec 2014 |     30 |       887 |             30 |       39 |        61 |         50 |
| Nov 2014 |     29 |       645 |             22 |       45 |        67 |         56 |
| Oct 2014 |     29 |       598 |             21 |       60 |        78 |         69 |
| Sep 2014 |     32 |       893 |             28 |       70 |        85 |         77 |
| Aug 2014 |     30 |       965 |             32 |       72 |        87 |         79 |
| Jul 2014 |     29 |       784 |             27 |       72 |        87 |         79 |
| Jun 2014 |     32 |      1018 |             32 |       69 |        87 |         78 |
| May 2014 |     30 |       702 |             23 |       63 |        82 |         72 |
| Apr 2014 |     33 |       722 |             22 |       50 |        71 |         60 |
| Mar 2014 |     29 |       830 |             29 |       41 |        62 |         52 |
| Feb 2014 |     28 |      1197 |             43 |       32 |        52 |         42 |
| Jan 2014 |     33 |      1100 |             33 |       38 |        59 |         49 |
| Dec 2013 |     30 |       856 |             29 |       40 |        63 |         51 |
| Nov 2013 |     33 |       686 |             21 |       48 |        70 |         59 |
| Oct 2013 |     30 |       527 |             18 |       61 |        77 |         69 |
| Sep 2013 |     30 |       817 |             27 |       69 |        86 |         77 |
| Aug 2013 |     28 |       991 |             35 |       72 |        86 |         79 |
| Jul 2013 |     31 |       993 |             32 |       73 |        86 |         79 |
| Jun 2013 |     30 |       847 |             28 |       66 |        83 |         74 |
| May 2013 |     29 |       605 |             21 |       59 |        76 |         67 |
| Apr 2013 |     34 |       791 |             23 |       47 |        66 |         57 |
+----------+--------+-----------+----------------+----------+-----------+------------+

Я почав із діаграми стовпців, легко порівнюючи місячні значення:

Щомісячний графік використання стовпців

Я передбачив хорошу площу фону або лінійний графік, відображений на вторинній (правій) вертикальній осі, що показує діапазони високого / низького, але зрозумів, що це буде проблематично для багаторічних угруповань.

Це було б легко за один рік:

2014 кВт · год Використання з температурами

Мені цікаво дізнатись, чи може хтось порекомендувати спосіб поєднання всіх річних даних в єдиний графік із порівнянням температури?

Чи можу я використати якесь співвідношення, яке могло б ефективно співвідносити використання кВт / год із середньою температурою ... чи якусь іншу техніку відображення, яку я оглядаю ... чи я затримуюся однією графікою на рік?

Відповіді:


18

Я хотів би припустити, що важливим є розробка фізично реалістичної, практично корисної моделі вартості енергії. Це допоможе краще виявити зміни у витратах, ніж будь-яка візуалізація необроблених даних. Порівнюючи це з рішенням, запропонованим на SO , ми маємо дуже приємне тематичне дослідження в різниці між підходом кривої до даних та проведенням значимого статистичного аналізу.

(Ця пропозиція ґрунтується на тому, що така модель підходила до мого власного домогосподарства десятиліття тому та застосовувала її для відстеження змін за цей період. Зауважте, що коли модель підходить, її можна легко обчислити в електронній таблиці з метою відстеження. зміни, тому ми не повинні відчувати себе обмеженими можливостями програмного забезпечення електронних таблиць.)

Для цих даних така фізично правдоподібна модель створює істотно іншу картину витрат на енергоресурси та використання витрат, ніж проста альтернативна модель (квадратична мінімальна площа, що відповідає щоденному використанню проти середньомісячної температури). Отже, простішу модель не можна вважати надійним інструментом для розуміння, прогнозування або порівняння моделей використання енергії.


Аналіз

Закон Ньютона про охолодження говорить про те, що, при хорошому наближенні, вартість обігріву (протягом одиниці часу) повинна бути прямо пропорційною різниці між зовнішньою температурою і внутрішньою температурою . Нехай ця константа пропорційності буде . Вартість охолодження також повинна бути пропорційною тій різниці температур з подібною - але не обов'язково однаковою - постійною пропорційність . (Кожен з них визначається теплоізоляційними можливостями будинку, а також ефективністю систем опалення та охолодження.)tt0αβ

Оцінка та (які виражаються у кіловатах (або доларах) на градус за одиницю часу) є одними з найважливіших речей, які можна досягти,αβ оскільки вони дозволяють нам передбачити майбутні витрати, а також виміряти ефективність будинок та його енергетичні системи.

Оскільки ці дані є загальним споживанням електроенергії, вони включають витрати на опалення, такі як освітлення, приготування їжі, обчислення та розваги. Також цікавою є оцінка цього середнього споживання базової енергії (за одиницю часу), яку я називатиму : вона дає змогу визначити, скільки енергії можна заощадити, і дає змогу передбачити майбутні витрати при підвищенні ефективності відомої величини . (Наприклад, через чотири роки я замінив піч на одну, яка стверджувала, що вона на 30% ефективніша - і справді це було саме так.)γ

Нарешті, як (грубе) наближення я припускаю, що будинок підтримується майже постійною температурою протягом року. (В моїй особистій моделі я припускаю дві температури, , відповідно для зими і літа влітку - але в цьому прикладі ще недостатньо даних, щоб їх достовірно оцінити, і все одно вони будуть досить близькими.) Знаючи це Значення допомагає оцінити наслідки підтримки будинку при дещо іншій температурі, що є одним із важливих варіантів енергозбереження.t0t0t1

Дані представляють надзвичайно важливе і цікаве ускладнення : вони відображають загальні витрати в періоди, коли зовнішні температури коливаються - і вони коливаються багато, зазвичай приблизно на чверть їх річного діапазону щомісяця. Як ми побачимо, це створює істотну різницю між точно описаною правильною базовою миттєвою моделлю та значеннями місячних підсумків. Ефект особливо виражений у міжмісячні періоди, коли відбувається або (або ні) нагрівання та охолодження. Будь-яка модель, яка не враховує цю різницю, помилково "подумає", що енерговитрати повинні бути за базовою ставкою протягом будь-якого місяця із середньою температурою , але реальність набагато інша.γt0

Ми не маємо (легко) детальної інформації про місячні коливання температури, крім їх діапазонів. Я пропоную поводитися з таким підходом, який практичний, але крихітний суперечливий. За винятком екстремальних температур, кожен місяць зазвичай спостерігається поступове підвищення або зниження температури. Це означає, що ми можемо вважати розподіл приблизно однаковим. Коли діапазон рівномірної змінної має довжину , ця змінна має стандартне відхилення . Я використовую це відношення для перетворення діапазонів (від до ) до стандартних відхилень. Але тоді, по суті для отримання чудово поведеної моделі, я зменшу варіювання на кінцях цих діапазонів, використовуючи NormalLs=L/6Avg. LowAvg. Highдистрибуції (з цією оцінкою SD та засобами, наданими Avg. Temp).

Нарешті, ми повинні стандартизувати дані до загального одиничного часу. Хоча це вже є в Daily kWh Avg.змінній, йому не вистачає точності, тому давайте замість цього розділимо загальну кількість днів, щоб повернути втрачену точність.

Таким чином, модель одиниці часу охолодження варто при температурі зовнішнього повітря від єYt

y(t)=γ+α(tt0)I(t<t0)+β(tt0)I(t>t0)+ε(t)

де - функція індикатора, а являє собою все, що не є явно зафіксованим у цій моделі. У нього є чотири параметри для оцінки: і . (Якщо ви справді впевнені в ви можете виправити його значення, а не оцінювати його.)Iεα,β,γt0t0

Повідомили загальні витрати в протягом періоду часу до , коли температура змінюється в залежності від часу , отже , будеx0x1t(x)x

Cost(x0,x1)=x0x1y(t)dt=x0x1(γ+α(t(x)t0)I(t(x)<t0)+β(t(x)t0)I(t(x)>t0)+ε(t(x)))t(x)dx.

Якщо модель взагалі хороша, коливання повинні становити середнє значення близьке до нуля, і, здавалося б, випадково змінюватись місяць у місяць. Апроксимація коливань у з нормальним розподілом середнього значення (середньомісячне середнє) та стандартне відхилення (як раніше було вказано з місячного діапазону) та з отриманням інтегралівε(t)ε¯t(x)t¯s(t¯)

y¯(t¯)=γ+(βα)s(t¯)2ϕs(t¯t0)+(t¯t0)(β+(αβ)Φs(t0t¯))+ε¯(t¯).

У цій формулі - це сукупний розподіл нормальної змінної нульової середньої величини та стандартного відхилення ; - його щільність.Φss(t¯)ϕ


Монтаж моделі

Ця модель, хоча і виражає нелінійну залежність між витратами та температурою, все ж є лінійною у змінних та . Однак, оскільки це нелінійно в , а невідомо, нам потрібна процедура нелінійної підгонки. Для ілюстрації я просто скинув його в максимізатор ймовірності (використовуючи для обчислення), припускаючи, що є незалежними та однаково розподіленими, з нормальними розподілами середнього нуля та загальним стандартним відхиленням .α,β,γt0t0Rε¯σ

За цими даними оцінок є

(α^,β^,γ^,t0^,σ^)=(1.489,1.371,10.2,63.4,1.80).

Це означає:

  • Витрата на опалення становить приблизно кВт / год / градус F.1.49

  • Вартість охолодження приблизно кВт / год / градус F. Охолодження трохи ефективніше.1.37

  • Базове (не опалювальне / охолоджуюче) використання енергії становить кВт / год. (Ця цифра є досить невизначеною; додаткові дані допоможуть її краще зменшити.)10.2

  • Будинок підтримується при температурі близько градусів F.63.4

  • Інші варіації, які явно не враховуються в моделі, мають стандартне відхилення кВт / год.1.80

Інтервали довіри та інші кількісні вирази невизначеності в цих оцінках можна отримати стандартними способами з максимальною ймовірністю.


Візуалізація

Щоб проілюструвати цю модель, на наступному малюнку викладено дані, базову модель, відповідність середньомісячним середнім значенням та просте квадратичне розміщення найменших квадратів.

Малюнок

Щомісячні дані відображаються у вигляді темних хрестів. Горизонтальні сірі лінії, на яких вони лежать, показують місячні діапазони температури. Наша основна модель, що відображає закон Ньютона, показана червоно-синьою лінією сегментів, що зустрічаються при температурі . Наша відповідність даним не крива , оскільки це залежить від температурних діапазонів. Тому вона зображена як окремі суцільні сині та червоні точки. (Тим не менше, оскільки місячні діапазони не сильно різняться, ці точки, схоже, відслідковують криву - майже таку ж, як пунктирна квадратична крива.) Нарешті, пунктирна крива - це квадратичний найменший розмір квадратів (до темних хрестів ).t0

Зауважте, наскільки пристосування відходять від базової (миттєвої) моделі, особливо при середніх температурах! Це ефект щомісячного усереднення. (Подумайте про те, як висота червоних та синіх ліній "розмазується" по кожному горизонтальному сірому сегменту. При екстремальних температурах все зосереджено на лініях, але при середніх температурах обидві сторони "V" збираються усередненими, відображаючи потребу для опалення в окремі часи та охолодження в інший час протягом місяця.)


Порівняння моделі

Два пристосування - той кропітко розвинений тут і простий, легкий, квадратичний прилад - тісно узгоджуються як між собою, так і з точками даних. Квадратне прилягання не настільки добре, але все ж пристойно: його скориговане середнє залишкове значення (за трьома параметрами) становить кВт / год, тоді як скоригований середній залишок моделі закону Ньютона (для чотирьох параметрів) становить кВт / год, приблизно на 5% нижче. Якщо все, що ви хочете зробити, це побудувати криву через точки даних, тоді простота та відносна вірність квадратичного пристосування рекомендують це.2.071.97

Однак квадратичне пристосування є абсолютно марним для вивчення того, що відбувається! Його формула,

y¯(t¯)=219.956.241t¯+0.04879(t¯)2,

не виявляє нічого корисного безпосередньо. Чесно кажучи, ми могли б трохи проаналізувати це:

  1. Це парабола з вершиною при градусів F. Ми можемо сприймати це як оцінку постійної температури будинку. Це суттєво не відрізняється від нашої першої оцінки в градуса. Однак прогнозована вартість при цій температурі становить кВт / год. Це вдвічі більше базового споживання енергії, що відповідає Закону Ньютона.t^0=6.241/(2×0.04879)=64.063.4219.956.241(63.4)+0.04879(63.4)2=20.4

  2. Граничні витрати на нагрівання або охолодження отримують з абсолютного значення похідної, . Наприклад, використовуючи цю формулу, ми б оцінили вартість обігріву будинку, коли зовнішня температура становить градусів, як кВт / год / градус F. Це вдвічі більше, ніж оцінюється значення Ньютона Закон .y¯(t¯)=6.241+2(0.04879)t¯906.241+2(0.04879)(90)=2.54

    Аналогічно, витрати на опалення будинку при зовнішній температурі градуси оцінюються як кВт / год / градус F. Це більше ніж удвічі більше, ніж оцінюється Законом Ньютона.32|6.241+2(0.04879)(32)|=3.12

    При середніх температурах квадратична помилка підходить в іншому напрямку. Дійсно, у своїй вершині в діапазоні від до градусів він прогнозує майже нульові граничні витрати на обігрів або охолодження, хоча ця середня температура включає дні, прохолодні як градусів і теплі градусів. (Мало хто з людей, які читають цю публікацію, все ще буде відключати тепло при градусах (= градусів)!)606850785010

Коротше кажучи, хоча у візуалізації це виглядає майже так само добре, квадратична велика помилка в оцінці основних величин інтересу, пов'язаних з використанням енергії. Таким чином, його використання для оцінки змін у використанні є проблематичним і має бути обережним.


Обчислення

Цей Rкод виконував усі обчислення та графіки. Його можна легко адаптувати до подібних наборів даних.

#
# Read and process the raw data.
#
x <- read.csv("F:/temp/energy.csv")
x$Daily <- x$Usage / x$Length
x <- x[order(x$Temp), ]
#pairs(x)
#
# Fit a quadratic curve.
#
fit.quadratic <- lm(Daily ~ Temp+I(Temp^2), data=x)
# par(mfrow=c(2,2))
# plot(fit.quadratic)
# par(mfrow=c(1,1))
#
# Fit a simple but realistic heating-cooling model with maximum likelihood.
#
response <- function(theta, x, s) {
  alpha <- theta[1]; beta <- theta[2]; gamma <- theta[3]; t.0 <- theta[4]
  x <- x - t.0
  gamma + (beta-alpha)*s^2*dnorm(x, 0, s) +  x*(beta + (alpha-beta)*pnorm(-x, 0, s))
}
log.L <- function(theta, y, x, s) {
  #   theta = (alpha, beta, gamma, t.0, sigma)
  #   x = time
  #   s = estimated SD
  #   y = response
  y.hat <- response(theta, x, s)
  sigma <- theta[5]
  sum((((y - y.hat) / sigma) ^2 + log(2 * pi * sigma^2))/2)
}
theta <- c(alpha=-1, beta=5/4, gamma=20, t.0=65, sigma=2) # Initial guess
x$Spread <- (x$Temp.high - x$Temp.low)/sqrt(6)            # Uniform estimate
fit <- nlm(log.L, theta, y=x$Daily, x=x$Temp, x$Spread)
names(fit$estimate) <- names(theta)
#$
# Set up for plotting.
#
i.pad <- 10
plot(range(x$Temp)+c(-i.pad,i.pad), c(0, max(x$Daily)+20), type="n", 
     xlab="Temp", ylab="Cost, kWh/day",
     main="Data, Model, and Fits")
#
# Plot the data.
#
l <- matrix(mapply(function(l,r,h) {c(l,h,r,h,NA,NA)}, 
                   x$Temp.low, x$Temp.high, x$Daily), 2)
lines(l[1,], l[2,], col="Gray")
points(x$Temp, x$Daily, type="p", pch=3)
#
# Draw the models.
#
x0 <- seq(min(x$Temp)-i.pad, max(x$Temp)+i.pad, length.out=401)
lines(x0, cbind(1, x0, x0^2) %*% coef(fit.quadratic), lwd=3, lty=3)
#curve(response(fit$estimate, x, 0), add=TRUE, lwd=2, lty=1)
t.0 <- fit$estimate["t.0"]
alpha <- fit$estimate["alpha"]
beta <- fit$estimate["beta"]
gamma <- fit$estimate["gamma"]
cool <- "#1020c0"; heat <- "#c02010"
lines(c(t.0, 0), gamma + c(0, -alpha*t.0), lwd=2, lty=1, col=cool)
lines(c(t.0, 100), gamma + c(0, beta*(100-t.0)), lwd=2, lty=1, col=heat)
#
# Display the fit.
#
pred <- response(fit$estimate, x$Temp, x$Spread)
points(x$Temp, pred, pch=16, cex=1, col=ifelse(x$Temp < t.0, cool, heat))
#lines(lowess(x$Temp, pred, f=1/4))
#
# Estimate the residual standard deviations.
#
residuals <- x$Daily - pred
sqrt(sum(residuals^2) / (length(residuals) - 4))
sqrt(sum(resid(fit.quadratic)^2) / (length(residuals) - 3))

4
Це може бути найкращий відповідь на будь-яке прочитане нами питання про переповнення стека. Я дуже вдячний за час, необхідний для пояснення логіки та аргументації рішення.
Шон

1
Фізика більш волохата, ніж ця. Конденсатор та випарник перемикають роль у нагріванні проти охолодження. Це означає, що вони діють як дві різні системи, а не одна безперервна. Дни ступеня опалення, дні ступеня опалення та дні ступеня осушення - це три окремі фактори, що залежать від витрат, і залежно від географічного положення (подумайте ak, wi, ca, az, mo, та fl) та рік можуть діяти безперервно (кінець опалювального сезону не є це не те, що початок охолодження). Достойна статистика за даними говорить, що існує 5 сезонів, а не 4. Травень - це власний сезон, принаймні протягом останніх 5 років.
EngrStudent

@EngrStudent Всі хороші бали та дуже цінуємо. Я хотів би стверджувати, що представлений тут підхід, хоча і спрощений, показує, що потрібно, щоб закласти основу, щоб стримати ці тонкі ефекти. Як тільки ви впораєтеся з великими умовами в моделі - і я думаю, ніхто не заперечуватиме, що температура повинна бути домінуючим фактором у витратах - тоді, якщо ви зробили це фізично осмисленим способом, ви зможете визначити інші терміни і, можливо, навіть точно оцінюють їх вплив. Якщо ви не впораєтеся з великими термінами правильно, то ви не маєте жодної надії характеризувати інших.
whuber

Я люблю цей добрий фундамент / аналіз, будь ласка, почуйте це як оплески, а не критику. Процес нагріву відрізняється від охолодження, тому квадратична квадратика з обох сторін може суперечити цьому. Котушка випарника знаходиться в приміщенні під час охолодження та на вулиці під час нагрівання. У тепловому насосі також є розморожування і "резервне копіювання". Крім того, компресор повинен докладати більше зусиль для боротьби з більш екстремальною зовнішньою температурою, тому ви не тільки рухаєтеся більше тепла, але й пересуваєте його на більш високу гору. Це не лінійно. Вологість повітря велика і може становити 2/3 бюджету енергії. Інфільтрація повітря.
EngrStudent

@EngrStudent Дякую ще раз - це все цікаві моменти. Я не здогадувався, що вологість може складати таку велику частину бюджету. Це такий вид спостереження, який ілюструє потенційну цінність поєднання хорошої теорії (або "концептуальної моделі" в деяких колах) зі статистичним аналізом.
whuber

0

Я отримав відповідь у StackOverflow . Якщо хтось має додаткові думки, я все ще дуже зацікавлений в альтернативних рішеннях.

/programming/29777890/data-visualization-how-to-represent-kwh-usage-by-year-against-average-temperatu


1
Рішення на SO неправдоподібно. Закон охолодження Ньютона , який є розумним наближенням першого порядку, корисним як точка відправлення, припускає, що графік використання енергії та температури повинен бути об'єднанням двох ліній (можливо, різних схилів). Середній показник ховає щоденні (і навіть погодинні) температурні перепади, які розмиють область на перетині цих ліній (де не потрібно ні опалення, ні охолодження). Тут може бути розумним квадратичне прилягання, але асимптотично прилягання повинно бути лінійним .
whuber

Я знаю, середня точність розмиття, але це дані, які я маю. Через неправильне розуміння статистики я не можу зрозуміти фрази "має бути об'єднання двох рядків ..." і "асимптотично відповідність має бути лінійною" . Від початківця POV, повідомлення SO здається інтуїтивно зрозумілим, оскільки відповідає моїм очікуванням, що споживання енергії збільшиться на протилежних кінцях температурної шкали, в той час як вона буде найнижчою в середньому діапазоні, де не потрібно було ні опалення, ні охолодження. Чи не було б квадратичне розміщення симетричним? Я не вірю, що споживання електроенергії симетричне, оскільки ми використовуємо більше енергії для нагріву, ніж для охолодження. Я вдячний за будь-які виправлення чи поради.
Шон

Квадратне пристосування, хоч і симетричне, є нефізичним в крайніх межах, оскільки воно говорить, що ви заплатите набагато більше за опалення при найнижчих температурах і набагато більше за охолодження при найвищих температурах, ніж фізично правдоподібно. Більше того, симетрію на ділянці можна було б очікувати лише тоді, коли витрати на охолодження будинку за градус такі ж, як витрати на його обігрів за градус, що передбачає, що системи опалення та охолодження однаково ефективні. Це може бути чи не так - але ви не повинні нав'язувати цю симетрію своїй моделі.
whuber

Я погоджуюсь, це відрізняється тим, що охолоджувати коштує більше, ніж тепло на градус. Однак, тому я розумію перший коментар, чи ви припускаєте, що квадратична відповідність з посади ЗО - хоча і розумна - не справді точна і що лінійна відповідність є технічно правильною відповіддю через закон охолодження Ньютона? Я не можу зрозуміти саме неправдоподібність рішення SO .
Шон

1
Я не міг повністю відповісти на своє останнє запитання в просторі для коментаря, тому надіслав його як відповідь. Я не бачу, як ви вважаєте, що за градусні витрати на охолодження вищі за градусні витрати на опалення. Ваші дані, схоже, вказують на протилежне (хоча витрати досить близькі, як можна було б очікувати). І зверніть увагу, що лінійна модель не передбачає лінійної підгонки ! Тут багато чого відбувається, щоб змусити дані систематично відхилятися від цієї основної моделі.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.