Хороші пакети «частого видобутку послідовностей» в Python?


14

Хтось використовував (і сподобалось) будь-які хороші пакети "частого видобутку послідовностей" в Python, крім FPM в MLLib? Я шукаю стабільний пакет, бажаний стилі, який підтримують люди. Дякую!

Відповіді:


6

Єдине, що я знайшов: https://github.com/bartdag/pymining

у них є реалізація, BIDEале код не підтримується.

PS Я приєднуюся до вашого питання: - |


Просто для уточнення, він не застосував BIDE, яка міняє часті закриті послідовності. Насправді він реалізував PrefixSpan, який міняє всі часті послідовності. PrefixSpan та BIDE мають однакові рамки перерахування шаблонів, і саме тому автори цитували документ BIDE.
Chuancong Gao

Що я зробив, врешті-решт, використовую: philippe-fournier-viger.com/spmf - Це
ліга

6

Я активно підтримую ефективну реалізацію як PrefixSpan, так і BIDE в Python 3, підтримуючи видобуток як частих, так і топ-k (закритих) послідовних зразків.

https://github.com/chuanconggao/PrefixSpan-py


Я хотів би реалізувати їх у JavaScript, але я не повністю розумію, як працюють ці алгоритми. Чи можете ви пояснити це простою англійською?
inf3rno

Я пропоную вам перевірити мою оригінальну мінімальну реалізацію PrefixSpan. Його основна частина займає лише 15 рядків. gist.github.com/chuanconggao/4df9c1b06fa7f3ed854d5d96e2ae499f
Chuancong Gao

Дякую! Я спробую перекласти його на js, але це буде непросто. :-) Afaik PrefixSpan будує прогнозовані бази даних на основі відповідності префікса. Я зараз читаю про BIDE, що теорія є ще кращим алгоритмом.
inf3rno

Занадто багато відмінностей між колекціями js та python. Мені не вдалося відтворити код у js. Я спробую ще раз пізніше.
inf3rno

Не впевнений, чи допомагає це, але у мене є ще одна версія Scala PrefixSpan. github.com/chuanconggao/PrefixSpan-scala Однак я настійно пропоную вам повністю зрозуміти алгоритм перед реалізацією.
Chuancong Gao

1

Я використовував FIM «s функцію fpgrowth в минулому , і вона працювала добре. Однак, болісно встановити на машинах Windows. Здається, це веб-сайт академії, тому я не впевнений, чи роблять вони багато оновлень коду з часом ...


1

Ви думали написати це самостійно? Тому що, мабуть, зараз немає оновленої бібліотеки, що підтримується.

Перевірте це, його основні - шаблони PrefixSpan та Closed / Maximal насправді не так важко реалізувати:

http://sequenceanalysis.github.io/



Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.