Перетворити одиниці вимірювання


10

Потрібно обчислити найбільш підходящу одиницю вимірювання для списку речовин, де речовини наведені в різних (але сумісних) одиничних обсягах.

Таблиця перетворення одиниць

Таблиця перетворення одиниць зберігає різні одиниці та спосіб співвідношення цих одиниць:

id  unit          coefficient                 parent_id
36  "microlitre"  0.0000000010000000000000000 37
37  "millilitre"  0.0000010000000000000000000 5
 5  "centilitre"  0.0000100000000000000000000 18
18  "decilitre"   0.0001000000000000000000000 34
34  "litre"       0.0010000000000000000000000 19
19  "dekalitre"   0.0100000000000000000000000 29
29  "hectolitre"  0.1000000000000000000000000 33
33  "kilolitre"   1.0000000000000000000000000 35
35  "megalitre"   1000.0000000000000000000000 0

Сортування за коефіцієнтом показує, що parent_idзв’язує дочірню одиницю з її числовою перевагою.

Цю таблицю можна створити в PostgreSQL за допомогою:

CREATE TABLE unit_conversion (
  id serial NOT NULL, -- Primary key.
  unit text NOT NULL, -- Unit of measurement name.
  coefficient numeric(30,25) NOT NULL DEFAULT 0, -- Conversion value.
  parent_id integer NOT NULL DEFAULT 0, -- Relates units in order of increasing measurement volume.
  CONSTRAINT pk_unit_conversion PRIMARY KEY (id)
)

Там повинен бути зовнішній ключ від parent_idдо id.

Таблиця речовин

У таблиці речовин перераховані конкретні кількості речовин. Наприклад:

 id  unit          label     quantity
 1   "microlitre"  mercury   5
 2   "millilitre"  water     500
 3   "centilitre"  water     2
 4   "microlitre"  mercury   10
 5   "millilitre"  water     600

Таблиця може нагадувати:

CREATE TABLE substance (
  id bigserial NOT NULL, -- Uniquely identifies this row.
  unit text NOT NULL, -- Foreign key to unit conversion.
  label text NOT NULL, -- Name of the substance.
  quantity numeric( 10, 4 ) NOT NULL, -- Amount of the substance.
  CONSTRAINT pk_substance PRIMARY KEY (id)
)

Проблема

Як би ви створили запит, який знаходить вимірювання, щоб представити суму речовин, використовуючи найменші цифри, що мають ціле число (і необов'язково реальний компонент)?

Наприклад, як би ви повернулися:

  quantity  unit        label
        15  microlitre  mercury 
       112  centilitre  water

Але не:

  quantity  unit        label
        15  microlitre  mercury 
      1.12  litre       water

Оскільки 112 має меншу кількість реальних цифр, ніж 1,12, а 112 - менше 1120. Однак у певних ситуаціях використання реальних цифр коротше - наприклад, 1,1 літра проти 110 сантиметрів.

Здебільшого у мене виникають проблеми з підбором правильної одиниці на основі рекурсивного відношення.

Вихідний код

Поки що у мене (очевидно, не працює):

-- Normalize the quantities
select
  sum( coefficient * quantity ) AS kilolitres
from
  unit_conversion uc,
  substance s
where
  uc.unit = s.unit
group by
  s.label

Ідеї

Чи потрібно це використовувати журнал 10 для визначення кількості цифр?

Обмеження

У підрозділів не всі десятки. Наприклад: http://unitsofmeasure.org/ucum-essence.xml


3
@mustaccio У мене була та сама проблема в попередньому місці, в дуже виробничій системі. Там нам довелося підрахувати кількості, які використовуються на кухні для доставки їжі.
dezso

2
Я пам’ятаю принаймні два рівні рекурсивних CTE. Я думаю, що спершу я підрахував суми з найменшою одиницею, яка з’явилася у списку для даної речовини, потім перетворила її на найбільшу одиницю, яка все ще має ненульову цілу частину.
dezso

1
Чи всі одиниці конвертовані потужністю 10? Чи заповнений список одиниць?
Ервін Брандстеттер

Відповіді:


2

Це виглядає некрасиво:

  with uu(unit, coefficient, u_ord) as (
    select
     unit, 
     coefficient,
     case 
      when log(u.coefficient) < 0 
      then floor (log(u.coefficient)) 
      else ceil(log(u.coefficient)) 
     end u_ord
    from
     unit_conversion u 
  ),
  norm (label, norm_qty) as (
   select
    s.label,
    sum( uc.coefficient * s.quantity ) AS norm_qty
  from
    unit_conversion uc,
    substance s
  where
    uc.unit = s.unit
  group by
    s.label
  ),
  norm_ord (label, norm_qty, log, ord) as (
   select 
    label,
    norm_qty, 
    log(t.norm_qty) as log,
    case 
     when log(t.norm_qty) < 0 
     then floor(log(t.norm_qty)) 
     else ceil(log(t.norm_qty)) 
    end ord
   from norm t
  )
  select
   norm_ord.label,
   norm_ord.norm_qty,
   norm_ord.norm_qty / uu.coefficient val,
   uu.unit
  from 
   norm_ord,
   uu where uu.u_ord = 
     (select max(uu.u_ord) 
      from uu 
      where mod(norm_ord.norm_qty , uu.coefficient) = 0);

але, здається, робить трюк:

|   LABEL | NORM_QTY | VAL |       UNIT |
-----------------------------------------
| mercury |   1.5e-8 |  15 | microlitre |
|   water |  0.00112 | 112 | centilitre |

Не дуже потрібні стосунки батько-дитина в unit_conversionтаблиці, тому що одиниці в одній родині, природно, пов'язані один з одним на порядок coefficient, доки у вас не встановлена ​​сім'я.


2

Я думаю, це можна значною мірою спростити.

1. Змініть unit_conversionтаблицю

Або, якщо ви не можете змінити таблицю, просто додайте стовпець exp10для "бази експонентів 10", який збігається з кількістю цифр для переміщення в десятковій системі:

CREATE TABLE unit_conversion(
   unit text PRIMARY KEY
  ,exp10 int
);

INSERT INTO unit_conversion VALUES
     ('microlitre', 0)
    ,('millilitre', 3)
    ,('centilitre', 4)
    ,('litre',      6)
    ,('hectolitre', 8)
    ,('kilolitre',  9)
    ,('megalitre',  12)
    ,('decilitre',  5);

2. Функція запису

для обчислення кількості позицій для зміщення вліво або вправо:

CREATE OR REPLACE FUNCTION f_shift_comma(n numeric)
  RETURNS int LANGUAGE SQL IMMUTABLE AS
$$
SELECT CASE WHEN ($1 % 1) = 0 THEN                    -- no fractional digits
          CASE WHEN ($1 % 10) = 0 THEN 0              -- no trailing 0, don't shift
          ELSE length(rtrim(trunc($1, 0)::text, '0')) -- trunc() because numeric can be 1.0
                   - length(trunc($1, 0)::text)       -- trailing 0, shift right .. negative
          END
       ELSE                                           -- fractional digits
          length(rtrim(($1 % 1)::text, '0')) - 2      -- shift left .. positive
       END
$$;

3. Запит

SELECT DISTINCT ON (substance_id)
       s.substance_id, s.label, s.quantity, s.unit
      ,COALESCE(s.quantity * 10^(u1.exp10 - u2.exp10)::numeric
              , s.quantity)::float8 AS norm_quantity
      ,COALESCE(u2.unit, s.unit) AS norm_unit
FROM   substance s 
JOIN   unit_conversion u1 USING (unit)
LEFT   JOIN unit_conversion u2 ON f_shift_comma(s.quantity) <> 0
                              AND @(u2.exp10 - (u1.exp10 - f_shift_comma(s.quantity))) < 2
                              -- since maximum gap between exp10 in unit table = 3
                              -- adapt to ceil(to max_gap / 2) if you have bigger gaps
ORDER  BY s.substance_id
     , @(u2.exp10 - (u1.exp10 - f_shift_comma(s.quantity))) -- closest unit first
     , u2.exp10    -- smaller unit first to avoid point for ties.

Поясніть:

  • ПРИЄДНАЙТЕ таблицю речовин та одиниць
  • Обчисліть ідеальну кількість позицій для зміщення з функцією f_shift_comma()зверху.
  • Вліво приєднайтесь до одиничної таблиці вдруге, щоб знайти одиниці, близькі до оптимального.
  • Виберіть найближчий блок за допомогою DISTINCT ON ()та ORDER BY.
  • Якщо не знайдено кращої одиниці, поверніться до того, що ми мали COALESCE().
  • Це повинно охоплювати всі кутові корпуси і бути досить швидким .

-> Демонстрація SQLfiddle


1
@DaveJarvis: І там я думав, що я все висвітлював ... ця деталь була б справді корисною в іншому ретельно продуманому питанні.
Ервін Брандстеттер
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.