Які основні проблеми дослідження в розподілених транзакціях?


10

Передумови: Обробка транзакцій була традиційною темою дослідження в теорії баз даних. В даний час розподілені транзакції популяризуються широкомасштабними розподіленими системами зберігання даних, які, як правило, включають розділ даних (також званий шардинг) та реплікацію даних .

Які основні проблеми дослідження в розподілених транзакціях?

Чи існують відомі теорії та рішення, які потребують (теоретичного) вдосконалення?

Будь-які посилання високо оцінені.

Відповіді:


9

Існує багато напрямків досліджень як в теорії, так і в практиці розподілених баз даних.

Однією з головних практичних проблем є реалізація ефективних механізмів контролю сумісності для розподілених та гео тиражуваних баз даних. З метою ефективного виконання транзакцій такі механізми можуть давати слабкіші гарантії, ніж серійність, що вимагає, щоб транзакції виконувались послідовно. Альтернативою серіалізаційності є розселення для знімків знімків [1], однак це було доведено, що воно погано масштабується до геовідтворюваних та розподілених систем. На сьогоднішній день визначено два різні варіанти ізоляції знімків (SI) для управління контролем одночасності в системах, що повторюються: Паралельна ізоляція знімків (PSI) [2] та немонотонна ізоляція знімків (NMSI) [ 3,4]. Що стосується того, що стосується розподілених баз даних (тобто, де дані розподіляються між різними сайтами),

Маючи різні поняття рівня ізоляції, які дають слабкіші гарантії, ніж серійність, іншим важливим питанням є написання програм таким чином, щоб страти все ще здавались серійними. Обгрунтований критерій ізоляції знімків був розроблений в [1]. Деякі люди з моєї групи зараз працюють над розробкою розумного критерію ІСС.

Ще одне актуальне питання, як з теоретичної, так і з практичної точки зору, - це питання розбиття транзакцій. В основному рубання - це методи статичного аналізу, в яких грубозернисті операції розбиваються на більш дрібні, дрібнозернисті транзакції. Щодо серійності, це питання було вирішено в [6], і отримана теорія була застосована для практичної реалізації в [7].

З точки зору теоретичних основ розподілених баз даних, було запропоновано використовувати методи з боку спільноти слабких моделей пам'яті [8], щоб формально визначити поведінку транзакцій. У [9] автори дають формальне поняття поведінки для транзакцій; той же підхід був використаний у [10] для визначення поведінки реплікуваних типів даних.

Нещодавно я та деякі мої колеги (Олексій Готсман та Гонгсеок Ян) побудували, виходячи з методик, розроблених у [8,9,10], теоретичну основу для визначення спостережуваної поведінки рівнів узгодженості для гео тиражуваних баз даних. Ми успішно застосували рамки, щоб дати аксіоматизацію SI, PSI та NMSI, кожен з яких ми виявилися правильними щодо простої реалізації. Ми також використали отриману теорію, щоб розробити критерій рубання PSI. Ці результати, сподіваємось, ми опублікували в осяжному майбутньому.

Будь ласка, не соромтесь написати мені, якщо у вас є інші запитання. Сподіваюся, це допомагає,

Андреа Серон.

Список літератури:

[1] Fekete та ін., Здійснення послідовності виділення знімків (2005)

[2] Совран та ін., Транзакційне зберігання для гео повторюваних систем (2011)

[3] Аркедані та ін., Немонотонна ізоляція знімків: масштабована та міцна консистенція для геореплікаційних транзакційних систем (2013)

[4] Аркедані та ін, Про масштабність ізоляції знімків (2013)

[5] Binnig та ін., Поширена ізоляція знімків: глобальні трансакції платять у глобальному масштабі, місцеві трансакції сплачуються локально

[6] Шаша та ін, Розбивка транзакцій: алгоритми та дослідження ефективності (1995)

[7] Чжан та ін, Ланцюги транзакцій: досягнення серіалізаційності з низькою затримкою в георозподілених системах зберігання даних (2013)

[8] Алглав, формальна ієрархія слабких моделей пам'яті (2012)

[9] Бакхардт та ін., Розуміння подій у майбутньому (2013)

[10] Buckhardt та ін., Типові типи даних: Специфікація, верифікація, Оптимальність (2014)


Дякую за всебічну відповідь. Для SI, чи існують у літературі поширені протоколи без заблокованих даних у повторених налаштуваннях? Або ця спроба є безглуздою, оскільки СІ недостатньо масштабується? Для PSI я прочитав статтю (Tim Kraska @ Eurosys'13), в якій згадувалося про її реалізацію в майбутній роботі. Чи підходить для цього генералізований паксос ? Які можливі плюси / мінуси / виклики порівняно з оригіналом у Совран та ін [2]? Знову дякую.
hengxin

2
Справді, SI не відповідає масштабам геовідтворюваних систем. У [4] вище автори доводять, що існують такі властивості, як справжня часткова реплікація, яку неможливо досягти геореплікацією СУБД, що працює на рівні послідовності СІ. У роботі [5] автори показують приклади страт, які поводяться відповідно до СІ локально (на одиночних осколках), але не глобально, і пропонують варіант СІ, який називається DSI. Що стосується MDCC, я не знаю цього документу, і я повинен визнати, що я не знаю деталей щодо реалізації узагальнених Paxos. Але я з радістю погляну, і відповім якнайшвидше.
Андреа Серон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.