Що нового в чисто функціональних структурах даних після Окасакі?

563

З моменту книги Кріса Окасакі 1998 року "Чисто функціональні структури даних" я не бачив занадто багато нових захоплюючих суто функціональних структур даних; Я можу назвати лише декілька:

IntMap (також винайдений Окасакі в 1998 році, але не присутній у цій книзі)
Пальчикові дерева (та їх узагальнення над моноїдами)

Існують також деякі цікаві способи реалізації вже відомих структур даних, наприклад використання "вкладених типів" або "узагальнених алгебраїчних типів даних" для забезпечення деревних інваріантів.

Які ще нові ідеї з'явилися з 1998 року в цій галузі?

— jkff
джерело

20

Приємне запитання. У мене просто студент запитав мене про це, і не знав відповіді.

— Суреш Венкат

Тут це нормально, але ви можете отримати кращі відповіді щодо переповнення стека. Якщо ви запитаєте там, будьте впевнені та посилайтесь на дискусію тут.

— Чарльз Стюарт

3

Ну, Haskell Reddit побачив це, тож звідти також надійдуть хороші відповіді, але відмінне запитання. Перебуваючи на півдорозі через книгу Окасакі, мені теж було цікаво, що я думаю. +1

— Роберт Массайолі

9

Це надихнуло мене задати відповідне запитання .

— jbapple

4

Повідомлення в блозі Окасакі з 2008 року до 10-ї річниці книги

— Каве

553

Нові суто функціональні структури даних, опубліковані з 1998 року:

2001: Ідеальні хеш-дерева та його попередник 2000 року, Швидкі та просторові пошуки три , Філ Багвелл : Мабуть, використовувались як фундаментальний будівельний блок у стандартній бібліотеці Clojure.
2001: Проста техніка реалізації черг на пріоритетні пошукові роботи , Ральф Хінзе : дійсно проста і красива методика реалізації цієї важливої структури даних (корисна, скажімо, в алгоритмі Дікстра). Реалізація особливо красива і читабельна завдяки великому використанню "моделей перегляду".
2002: завантаження односторонніх гнучких масивів , автор: Ральф Гінзе : Подібно до списків випадкового доступу Окасакі, але вони можуть бути налаштовані на зміну часу взаємодії consта індексації.
2003: Нові деканти, які не підлягають передачі , Раду Міхаеску та Роберт Тарджан : нова робота над старішою роботою (Каплан та Тарджан), яку цитує Окасакі ( остання версія роботи Каплана і Тарджана була опублікована в 2000 році ). Ця версія в чомусь простіша.
2005: Максифобічні купи ( папір та код ), Кріс Окасакі : Представлений не як нова, більш ефективна структура, а як спосіб викладати черги з пріоритету.
2006 рік: Чисто функціональні сортовані списки постійного часу з найгіршими випадками : Герт Столтінг Бродал, Крістос Макрис та Костас Циклас : Відповідає на невирішене питання про Каплана та Тарджана, демонструючи структуру з вставкою, пошуку, видалення та видалення O (lg n) (1) конмат.
2008: Настійно стійкі спроби ефективного контролю версій : Ерік Д. Демен, Штефан Лангерман та Ерік Прайс : Представляє кілька структур даних для спроб, які мають ефективну навігацію та модифікацію біля листя. Деякі суто функціональні. Інші фактично покращують давню структуру даних Dietz et al. для повністю стійких (але не зв'язаних стійких або чисто функціональних) масивів. У цьому документі також представлені суто функціональні дерева зрізаних посилань , які іноді називають "динамічними деревами".
2010 рік: новий чисто функціональний алгоритм видалення червоно-чорних дерев Метт Мойт: Як алгоритм вставки червоно-чорного дерева Окасакі, це не нова структура даних або нова операція над структурою даних, а новий, простіший спосіб написати відому операцію.
2012: RRB-Дерева: Ефективні незмінні вектори , Філ Багвелл і Тіарк Ромпф : розширення до Hash Array Mapped Tries, що підтримує незмінне конкатенацію векторів, вставлення та розщеплення за O (lg n) час, зберігаючи індекс, оновити та швидкості введення вихідного незмінного вектора.

Відомий у 1997 році, але не обговорювався в книзі Окасакі:

Багато інших стилів збалансованого дерева пошуку . AVL, брат, врівноважений, обмежений баланс та багато інших збалансованих дерев пошуку можуть бути (і були реалізовані) виключно функціонально шляхом копіювання контуру. Можливо, заслуговують особливої згадки:
- Нарізані дерева пошуку Семюеля В. Бента, Даніеля Д. Слейтора та Роберта Е. Тарджана : ключовий елемент у праці Бродаля та ін. За 2006 рік та статті Demaine et al. У 2008 році.
Нескінченні набори, які допускають швидкий вичерпний пошук , Мартін Ескардо : Можливо, сама по собі структура даних.
Кріс Окасакі : три алгоритми щодо дерев Брауна : дерева Брауна пропонують багато операцій стеку в гіршому випадку O (lg n). Ця межа перевершується багатьма іншими структурами даних, але дерева Браунаconsв другому аргументімаютьледачу операцію, і тому вони можуть використовуватися як нескінченні стеки певними способами, які інші структури не можуть.
Розслаблена купа min-max: Об'єднана черговість з двостороннім пріоритетом та KD heap: Ефективна багатовимірна черговість пріоритетів , Юженг Дін та Марк Аллен Вайс : Вони бувають чисто функціональними, хоча це не обговорюється в документах . Я не думаю, що досягнуті межі часу є кращими, ніж ті, що можна досягти, використовуючи пальчикові дерева (Гінзе та Патерсон або Каплан і Тарджан) як чергові чергові черги, але я думаю, що структури Дінг і Вайс використовують менше місця .
Застібка-блискавка , Джерард Хует : Використовується у багатьох інших структурах даних (таких як пальчикові дерева Гінза та Патерсона), це спосіб перетворення структури даних всередину.
Списки відмінностей - це O (1) списки, що підлягають каналу, з перетворенням O (n) у звичайні consсписки. Вони, очевидно, були відомі ще з античності в громаді Пролога, де вони перетворилися на O (1) у звичайні consсписки. Трансформація O (1) здається неможливою в традиційному функціональному програмуванні, але абстракція отворів Мінаміде з POPL '98 обговорює спосіб, який дозволяє O (1) додавати і O (1) перетворення в рамках чистого функціонального програмування. На відміну від звичайних реалізацій функціонального програмування різницьких списків, які базуються на закритті функцій, абстрагування отворів по суті є тими ж (як у їх використанні, так і в їх реалізації), як і у списках відмінностей Prolog. Однак здається, що роками єдиною людиною, яка це помітила, булоодин із рецензентів Minamide .
Унікально представлені словники підтримують вставлення, оновлення та пошук з обмеженням, що жодна дві структури, що містять однакові елементи, не можуть мати виразних форм. Для прикладу, відсортовані спільно окремі списки представлені однозначно, але традиційні дерева AVL - ні. Спробу також унікально представлені. Тарджан і Сундар у "Унікальних представленнях бінарних дерев пошуку та тестуванні рівності множин та послідовностей" показали суто функціональний унікально представлений словник, який підтримує пошук у логарифмічному часі та оновлення в час. Однак він використовує простір . Існує просте подання з використанням дерев Braun, яке використовує лише лінійний простір, але має час оновлення $O(\sqrt{n})$ $\Theta(n \lg n)$ $\Theta(\sqrt{n \lg n})$ та час пошуку $\Theta(\lg^2 n)$

Переважно функціональні структури даних до, під час і після книги Окасакі:

Багато процедур для того, щоб зробити структуру даних стійкою, повністю стійкою або конфліктно стійкою : Хаїм Каплан написав чудове опитування на цю тему . Дивіться також вище роботи Demaine та ін., Які демонструють повністю стійкий масив у просторі (де - кількість операцій, коли-небудь виконаних на масиві) та очікуваний час доступу. $O(m)$ $m$ $O(\lg \lg n)$
1989: Рандомізовані дерева пошуку Сесілії Р. Арагон та Раймунда Сейделя : Вони обговорювались в чисто функціональній обстановці Гаєм Е. Блеллохом та Маргарет Рейд-Міллер у швидких операціях із застосуванням трапез, а також Деном Бландфордом та Гаєм Блеллохом у функціональних операціях з Треки ( код). Вони забезпечують усі операції чисто функціональних пальців пальців і упереджених дерев пошуку, але потребують джерела випадковості, роблячи їх не чисто функціональними. Це також може визнати недійсною складність часу операцій над треупами, припускаючи супротивника, який може проводити операції та повторювати тривалі. (Це та сама причина, чому аргументи імперативної амортизації не є дійсними в стійких умовах, але для цього потрібен супротивник із секундоміром)
1997: Пропускні дерева, альтернативна структура даних для пропускних списків за паралельним підходом , Ксав'є Мессгегером та вивчення подвійності між пропускними списками та двійковими деревами пошуку , Брайан К. Дін та Захарі Х. Джонс : Пропуск списків не є суто функціональні, але вони можуть бути реалізовані функціонально як дерева. Як і треї, вони вимагають джерела випадкових бітів. (Можна зробити пропускні списки детермінованими, але, переклавши їх на дерево, я думаю, що вони є лише іншим способом перегляду 2-3 дерев.)
1998: Усі амортизовані структури в книзі Окасакі! Окасакі винайшов цей новий метод змішування амортизації та функціональних структур даних, які раніше вважалися несумісними. Це залежить від запам'ятовування, яке, як згадували Каплан та Тарджан, насправді є побічним ефектом. У деяких випадках ( наприклад, PFDS на SSD з причин продуктивності ), це може бути недоцільним.
1998: Прості конфліктно стійкі списки каналів , від Хаїма Каплана, Кріса Окасакі та Роберта Е. Тарджана : Використовує модифікацію під кришкою для надання амортизованих O (1) декабельних деків, представляючи той самий інтерфейс, що і раніше (суто функціональний, але з запам'ятовуванням ) версія, що міститься в книзі Окасакі. Раніше Каплан і Тарджан створили суто функціональну O (1) найгіршу структуру, але вона суттєво складніша.
2007 рік: Як було сказано в іншій відповіді на цій сторінці, напівстійкі структури даних та стійкі знахідки об'єднання від Sylvain Conchon та Jean-Christophe Filliâtre

Методи перевірки функціональних структур даних до, під час і після книги Окасакі:

Фантомні типи - це старий метод створення API, який не допускає певних неправильно сформованих операцій. Витончене їх використання можна знайти у полегшених статичних можливостях Олега Кисельова та Чунг-Ше Шаня .
Вкладені типи насправді не новіші за 1998 рік - Окасакі навіть використовує їх у своїй книзі. Є багато інших прикладів, яких немає в книзі Окасакі; деякі - нові, а деякі - старі. Вони включають:
- Червоно-чорні дерева Стефана Карса з типами ( код )
- AVL дерева Росса Патерсона ( дзеркало )
- Кріс Окасакі " Від швидкої експоненції до квадратних матриць: пригода за типами
- Позначення Річарда С. Берда та Росса Пітерсона де Бреййн як вкладений тип даних
- Числові уявлення Ральфа Гінзе як вкладені типи даних вищого порядку .
Не всі GADT також не такі вже й нові. Вони є нещодавним доповненням до Haskell та деяких ML, але, я думаю, вони були присутніми в різних типізованих лямбда-калькуляціях з 1970-х .
2004-2010: Кок і Ізабель за правильність . Кілька людей використовували докази теорем для перевірки правильності чисто функціональних структур даних. Coq може витягнути ці перевірки до робочого коду в Haskell, OCaml та Scheme; Ізабел може добути до Haskell, ML та OCaml.
- Coq:
  - П'єр Летузей та Жан-Крістоф Філіатре формалізували червоно-чорні та AVL (ish) дерева, знайшовши помилку в стандартній бібліотеці OCaml .
  - Я формалізував асимптотично оптимальні пріоритетні черги Бродала та Окасакі .
  - Артур Шарро оформив 825 з 1700 рядків ML в книзі Окасакі .
- Ізабель:
  - Тобіас Ніпков та Корнелія Пуш формалізували дерева AVL .
  - Віктор Кунчак формалізував незбалансовані дерева бінарного пошуку .
  - Пітер Ламміч опублікував рамку колекції Isabelle Collections , яка включає формалізацію ефективних чисто функціональних структур даних, таких як червоно-чорні дерева та спроби, а також структури даних, які є менш ефективними при постійному використанні, наприклад дворядні черги (без ліньки Окасакі з лінькою ) та хеш-таблиці.
  - Пітер Ламміч також опублікував формалізацію деревних автоматів , пальцевих дерев Hinze & Patterson (з Бенедікт Нордхофф та Стефаном Кернером), а також чисто функціональні черги пріоритетів Бродала та Окасакі (з Рене Мейсом та Фінном Нільсеном).
  - Рене Нойман формалізував черги біноміального пріоритету .
2007 рік: Удосконалений вигляд перевірки типу "Стардуст " Джошуа Данфілд : У цьому документі використовуються типи уточнення для ML, щоб знайти помилки у функції видалення червоно-чорного дерева SMLNJ.
2008: Легкий аналіз напівформальної часової складності для чисто функціональних структур даних Нілса Андерса Даніельссона : Використовує Агда з анотацією вручну, щоб довести часові межі для деяких PFDS.

Імперативні структури даних або аналізи, про які не йдеться в книзі Окасакі, але пов'язані з суто функціональними структурами даних:

Soft Heap: Приблизний Queue Пріоритету при оптимальній швидкості помилок , по Бернарду Чазел : Ця структура даних не використовує масиви, і тому спокусила спочатку IRC канал #haskell і більш пізніх користувач переповнення стека , але вона включаєdeleteв про (Л.Г. п) , що зазвичай неможливо у функціональній обстановці та імперативному амортизованому аналізі, що не є дійсним у суто функціональній обстановці.
Збалансовані дерева бінарного пошуку з оновленнями пальців O (1) . Як зробити структури даних стійкими, Джеймс Р Дрісколл, Ніл Сарнак, Даніель Д. Слейтор та Роберт Е. Тарджан представляють метод групування вузлів у червоно-чорному дереві так, щоб постійні оновлення потребували лише місця O (1). Суто функціональні деки та пальчикові дерева, розроблені Тарханом, Капланом та Міхеску, використовують дуже схожу техніку групування, щоб дозволити оновлення O (1) на обох кінцях. AVL-дерева для локалізованого пошуку від Атанасіоса К. Цакалідіса працюють аналогічно.
Швидше купи спарювання або краще оцінки для спарювання куп : Оскільки книга Okasaki була опублікована, з'явилися кілька нових аналізи імперативних куп спарювання, в тому числі Сполучення куп з O (журнал журнал п) зменшити вартість Амр Elmasry і до остаточного аналізу Сполучення куп по Сет Петті. Можливо, можливо, застосувати частину цього твору до лінивих купи Окасакі.
Детерміновані упереджені пальчикові дерева : у Biased Skip Lists Амітабхи Багчі, Адама Л. Бухсбаума та Майкла Т. Гудріча представлений дизайн детермінованих упереджених списків пропусків. Через вищезазначений список пропускання / перетворення дерев можна зробити детерміновані упереджені дерева пошуку. Упереджене прокручування списків, описане Джоном Іаконо та Езгюром Озканом у " Збірних словниках", може бути можливим на упереджених пропускних деревах. Demaine et al. Пропонують упереджене пальцеве дерево. у своїй роботі про суто функціональні спроби (див. вище) як спосіб зменшити часові та просторові межі щодо оновлення пальців у спробах.
The String B-Tree: Нова структура даних для пошуку рядків у зовнішній пам'яті та її застосування Паоло Феррагіна та Роберто Гроссі - це добре вивчена структура даних, що поєднує переваги спроб та B-дерев.

— jbapple
джерело

5

Я не пам’ятаю, щоб встановити прапорець «Вікі спільноти» на цю відповідь. Чи можна скасувати це?

— jbapple

7

@jbapple: після певної кількості редагувань всі публікації стають вікі спільноти. Це вражаюче ретельний огляд там. Дякую.

— Філ Міллер

29

Чудовий список! Що змушує мене побажати, щоб Окасакі видав друге видання.

— Раду ГРИГо

4

Зауважте, що Ізабель / HOL може генерувати код для SML, OCaml, Haskell, Scala. Інструмент Haskabelle також може імпортувати Haskell в Isabelle / HOL.

— Макарій

2

Термінологія "вилучення програм" є однією з Coq: ви берете конструктивний доказ і робите з нього виконувану програму, знімаючи деякі речі. У Isabelle це називається "генерація коду" і працює по-різному, використовуючи специфікації HOL як псевдо-код, а не докази. За словами Бергхофера, доказ видобутку в Ізабелі / HOL працює як Coq, але в наші дні використовується рідко.

— Макарій

63

До вже зроблених відмінних нот додамо блискавки .

Хует, Джерард. Журнал функціонального програмування «Функціональна перлина: блискавка» 7 (5): 549–554, вересень 1997 року.

Вікіпедія: Zipper (структура даних)

— Метт Мог
джерело

4

Блискавки - ДУЖЕ. У багатьох випадках використання вони дозволяють представленням на основі дерев стати «правильним» вибором для багатьох видів даних, де в іншому випадку це буде дещо складніше

— Carter Tazio Schonwald

1

Приклад їх використання для маніпуляцій з XML: anti-xml.org/zippers.html

— Механічний равлик

40

Conchon, Filliatre, Стійка структура даних UNION-FIND та напівпостійні структури даних .

— Раду ГРИГоре
джерело

Нічого собі, наполегливий ЗВ'ЯЗОК УСІЛ! Дякую!

— jkff

3

Ну, вид ... Дивіться статтю.

— Раду ГРИГо

1

... або, якщо ви хочете, подивіться якийсь код (від Метта Паркінсона) github.com/septract/jstar/blob/master/src/utils/…

— Radu GRIGore

5

Тепер я бачу, чому коментар "роду .." мав відгук. Вони мають хороші показники лише тоді, коли кожен винятково або не використовує наполегливість, або весь час займається зворотним зв'язком: якщо ви часто використовуєте і "нову", і "стару" версії, ви накручені. Хоча крута ідея про вкорінення.

— jkff

Посилання на Раду тепер можна знайти на сайті github.com/septract/jstar-old/blob/…

— jbapple

20

Я б додав версію McPride-блискавки в якості похідних типів даних.

— жоден
джерело

Мені подобаються такі речі. Це просто так круто, що похідна має додаток настільки диво відрізняється від знаходження швидкості змін!

— SamB

3

SamB, вас також можуть зацікавити похідні регулярних виразів (якщо ви про них ще не знали).

— jbapple

3

Ось оригінальний документ про похідні від регулярних виразів .

— jameshfisher

14

Rangemaps

Це спеціалізована структура даних, але її можна використовувати як заміну для дієти Мартіна Ервіга з дещо іншими властивостями, тому принаймні є одна існуюча структура даних для порівняння. Сам DIET був описаний у статті JFP у 1998 році, тому, можливо, він не включений до чисто функціональних структур даних.

— Складні див. Біо
джерело

7

За результатами роботи, пов'язаної з вищезгаданим документом 2012 року, робота над векторами RRB з тих пір була розширена та опублікована в ICFP'15.

Вектор RRB: практична незмінна послідовність загального призначення http://dl.acm.org/citation.cfm?id=2784739

— Майк Рейні
джерело