Альтернатива самостійному приєднанню


10

Я задав тут питання: /programming/43807566/how-to-divide-two-values-from-the-same-column-but-at-different-rows

про поділ значень з тієї ж таблиці, у тому самому стовпці, але в різних рядках. Зараз у мене є проблема, коли в мене більше чисельників і знаменників (з різними uns). Чи все ж self joinє хорошим способом вирішити цю проблему за допомогою Postgres чи є кращі рішення?

Приклад:

| postcode | value | uns |
|----------|-------|-----|
|       AA |    40 |  53 |
|       BB |    20 |  53 |
|       AA |    10 |  54 |
|       AA |    20 |  55 |
|       AA |    10 |  56 |
|       AA |    30 |  57 |
|       AA |    50 |  58 |
|       BB |    10 |  54 |
|       BB |    10 |  55 |
|       BB |    70 |  56 |
|       BB |    80 |  57 |
|       BB |    10 |  58 |

Результат повинен бути:

| postcode | formula    |
|----------|------------|
|       AA | 18.888...  |
|       BB | 14.375     |

Там, де значення згруповані за поштовим індексом, і формула (значення з uns):

(V53 * V56 + V54 * V57 + V55 * V58) / (V56 + V57 + V58)

Зверніть увагу, щоб уникнути можливого поділу на нуль. Формула може бути ще складнішою, але це хороший приклад.


чи є на вашому столі поле, яке прапор, рядки якого є чисельниками та знаменниками?
McNets

ні, знаменник - це значення значень з не 56, 57, 58.
Довільно

Здається, найкращим рішенням буде перекидання даних, щоб unsстати назвами стовпців - звідти, будь-яка формула використовує значення, повинна стати придатною для використання. Чи буде формула жорсткою, або динамічно виведена якось?
RDFozz

є кілька формул (~ 30), які знадобляться, щоб створити занадто багато таблиць
рандомізувати

Відповіді:


3

Це основна проблема зсуву / перехресних таблиць , як Майкл уже точно поставлений діагноз .

Якщо ви не знайомі з tablefuncмодулем в Postgres, прочитайте тут основні інструкції:

Запит стає простим і дуже швидким (швидше, ніж інші рішення, представлені тут):

SELECT (v53 * v56 + v54 * v57 + v55 * v58) / NULLIF(v56 + v57 + v58, 0)
FROM   crosstab(
   'SELECT postcode, uns, value FROM tbl ORDER BY 1'
 , 'SELECT generate_series(53,58)'
   ) AS ct (postcode text
          , v53 numeric, v54 numeric, v55 numeric
          , v56 numeric, v57 numeric, v58 numeric);

NULLIF щоб запобігти діленню на нуль.

dbfiddle тут


6

Ви можете об'єднати всі пари не / значення в об’єкт JSON, а потім використовувати їх для доступу до значень UNS за назвою. Це вимагає певного кастингу, оскільки значення можуть бути вилучені лише як текст з об'єкта JSON, але формула виглядає дуже схоже на ваш опис:

with vals(postcode, v) as (
  select postcode, json_object_agg(uns, value)
  from x
  group by postcode
), factors (postcode, denominator, divisor) as (
  select postcode, 
         (v->>'53')::decimal * (v->>'56')::decimal + (v->>'54')::decimal * (v->>'57')::decimal + (v->>'55')::decimal * (v->>'58')::decimal,
         (v->>'56')::decimal + (v->>'57')::decimal + (v->>'58')::decimal
  from vals
)
select postcode, 
       denominator / nullif(divisor, 0)
from factors;

Я розділив агрегацію, оцінку знаменника та дільника та остаточний поділ на три етапи, щоб зробити його більш зрозумілим.

Приклад в Інтернеті: http://rextester.com/IZYT54566


Ви можете спростити формулу, створивши функцію:

create function val(p_vals json, p_uns text)
  returns decimal
as $$
  select (p_vals ->> p_uns)::decimal;
$$
language sql;

with vals (postcode, v) as (
  select postcode, json_object_agg(uns, value)
  from x
  group by postcode
), factors (postcode, denominator, divisor) as (
  select postcode, 
         val(v, '53') * val(v, '56') + val(v, '54') * val(v, '57') + val(v, '55') * val(v, '58'),
         val(v, '56') + val(v, '57') + val(v, '58')
  from vals
)
select postcode, 
       denominator / nullif(divisor, 0)
from factors;

4

Для цього підійде модель PIVOT. Він перетворює значення рядків у стовпці в одному рядку відповідно до їх загального ключа. Є кілька способів цього здійснити. Деякі вимагають лише одного сканування таблиці.

Після PIVOT у вас буде таблиця з одним рядком на поштовий індекс та стовпцем на значення. Залишок запиту буде записаний так, ніби він посилається на одну таблицю.


3

Якщо припустити, що (postcode, uns)це UNIQUE(ймовірно, ПК), шаблон PIVOT, як уже коментував @ michael-green, може бути реалізований портативно, використовуючи наступний запит:

SELECT
     postcode, 
     CAST(V53 * V56 + V54 * V57 + V55 * V58 AS numeric) 
         / nullif(V56 + V57 + V58, 0) AS formula
FROM
    (SELECT
         postcode,
         sum(case when uns=53 then value end) AS v53,     
         sum(case when uns=54 then value end) AS v54,     
         sum(case when uns=55 then value end) AS v55,     
         sum(case when uns=56 then value end) AS v56,
         sum(case when uns=57 then value end) AS v57,
         sum(case when uns=58 then value end) AS v58
    FROM
         t
    GROUP BY
         postcode
    ) AS s
ORDER BY
    postcode ;

Перевірте це на SQLFiddle .


3

Якщо припустити, що (postcode, uns)це UNIQUE(мабуть, ПК), мабуть, найпростіший спосіб, мабуть, самий портативний, хоча, мабуть, не оптимальний: використовуйте стільки під виборів, скільки потрібно :

SELECT
    postcode,
    ((SELECT value FROM t WHERE t.uns = 53 AND t.postcode = p.postcode) *
     (SELECT value FROM t WHERE t.uns = 56 AND t.postcode = p.postcode) +
     (SELECT value FROM t WHERE t.uns = 54 AND t.postcode = p.postcode) *
     (SELECT value FROM t WHERE t.uns = 57 AND t.postcode = p.postcode) +
     (SELECT value FROM t WHERE t.uns = 55 AND t.postcode = p.postcode) *
     (SELECT value FROM t WHERE t.uns = 58 AND t.postcode = p.postcode)
    )::double precision / 
     nullif( (SELECT sum(value) FROM t 
              WHERE t.uns IN (56, 57, 58) AND t.postcode = p.postcode), 0)
    AS formula
FROM
    (SELECT DISTINCT postcode FROM t) AS p
ORDER BY
    postcode ;

Перевірте на SQLFiddle .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.