Огляд
Для зберігання нечітких дат (або навіть просто нечітких дат) існує багато можливих уявлень і, таким чином, схем баз даних:
- Дата та час та код, що вказує на його точність чи точність
- Дата та час та інтервал, коли існує кілька можливостей представлення інтервалу:
- Представити всі інтервали у вигляді цілої (або іншої числової) кількості певної фіксованої одиниці, наприклад, днів, хвилин, наносекунд.
- Представити інтервал як цілою (або іншою числовою) величиною, так і кодом із зазначенням його одиниць.
- Час початку та закінчення дати
- Рядок
- Розподіл ймовірностей:
- Десяткові або величини з плаваючою комою для параметрів, які задають конкретний розподіл у певній родині, наприклад, середнє та стандартне відхилення нормального розподілу.
- Функція розподілу ймовірностей, наприклад, як (пошук) коду (можливо, з параметрами конкретних значень) або як вираз у достатньо виразній мові, форматі чи поданні.
[1], [2] і [3] - це всі (неявно) рівномірні інтервали, тобто сукупність (однаково) можливих моментів часу.
[4] є найбільш експресивним, тобто дозволяючи будь-які можливі (або принаймні довільно довгі) письмові мовні пропозиції або фрази. Але з цим також найважче працювати. В межах межі, для обміну довільними значеннями потрібно буде ШІ на рівні людини. Практично діапазон можливих значень повинен бути суворо обмежений, а альтернативні «структуровані» значення, ймовірно, будуть бажані для багатьох операцій, наприклад, сортування, пошук.
[5] - це, мабуть, найбільш загальне компактне зображення, яке (дещо) практично.
Уніфіковані інтервали
Уніфіковані інтервали - це найпростіший компактний спосіб представити набір (можливих) значень дати та часу.
Для [1] ігноруються частини значення дати-часу, тобто частини, що відповідають одиницям, більш точним, ніж зазначена точність або точність; в іншому випадку це еквівалентно [2], а код точності / точності еквівалентний інтервалу з тими ж одиницями (і мається на увазі кількість 1).
[2] та [3] виразно еквівалентні. [1] суворо менш виразний, ніж будь-який, оскільки існують ефективні інтервали, які неможливо представити [1], напр. нечіткий час-дату, еквівалентний 12-годинному інтервалу, який охоплює межу дати.
[1] користувачам легше вводити дані, ніж будь-яке інше представлення, і, як правило, потрібно вимагати (принаймні трохи) менше вводити текст. Якщо дати можна вводити в різних текстових поданнях, наприклад, "2013", "2014-3", "2015-5-2", "30.07.2016 11p", "2016-07-31 18:15" , точність або точність також можна автоматично виводити з вхідних даних.
Точність або точність [1] також найпростіше перетворити у форму, яку слід передати користувачам, наприклад, "2015-5 з місячною точністю" до "травня 2015", порівняно з "13 травня 2015 2p, плюс або мінус 13,5 днів" (тому зауважте, що останній не може бути представлений [1] у будь-якому випадку).
Струни
Практично, рядкові значення потрібно буде перетворити на інші представлення для запиту, сортування чи порівняння численних значень. Отже, хоча будь-яка письмова природна (людська) мова є строго виразнішою, ніж [1], [2], [3] або [5], ми ще не маємо засобів для обробки набагато поза стандартними текстовими поданнями або форматами. Враховуючи це, це, мабуть, найменш корисне представлення саме по собі .
Однією з переваг цього представлення є те, що значення на практиці повинні бути представлені користувачам такими, які є, і не вимагати, щоб трансформація була легко зрозумілою.
Імовірні розподіли
Розподіли ймовірностей узагальнюють рівномірні інтервальні подання [1], [2], [3] та (можливо) є еквівалентними (загальним) поданням рядків [4].
Однією з переваг розподілу ймовірностей над рядками є те, що перша є однозначною.
[5-1] було б доречно значення, які (здебільшого) відповідають існуючому розподілу, наприклад, значення часу-дати, що виводиться з пристрою, для якого відомо вимірювання (або вважається), що відповідає певному розподілу.
[5-2], мабуть, найкращий (дещо) практичний спосіб компактно представити довільні значення "нечітких дат". Звичайно, обчислення конкретних розподілів ймовірностей, що використовуються, є певні цікаві (і, можливо, неможливі) проблеми, які слід вирішити під час запитів, сортування чи порівняння різних значень, але багато цього, мабуть, уже відомо або вирішено десь у існуючих математичної та статистичної літератури, тому це безумовно виступає як надзвичайно загальне та неоднозначне уявлення.