Максимальний та закритий частий - відповідь включена


10

My  dataset:
1:A,B,C,E
2:A,C,D,E
3:     B,C,E
4:A,C,D,E
5:    C,D,E
6:    А,D,Е

Я хочу дізнатися про максимальні часті набори предметів та закриті часті набори предметів .

  • Частий набір елементів є максимальним, якщо він не має частих наборів.ХЖ
  • Частий набір елементів X ∈ F закритий, якщо він не має суперсети з однаковою частотою

Тож я порахував появу кожного набору елементів.

{A} = 4 ;  {B} = 2  ; {C} = 5  ; {D} = 4  ; {E} = 6

{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2; 
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3

{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3; 
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3

{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0

Min_Support встановлено на // Дуже важливо. Дякую Steffen, що нагадали про це.50

Чи максимальний = ?{А,Б,С,Е}

Чи закриті = ?{А,Б,С,D} анг {Б,С,D,Е}

Відповіді:


5

Я знайшов дещо розширене визначення в цьому джерелі (яке включає гарне пояснення). Ось більш надійне (опубліковане) джерело: CHARM: Ефективний алгоритм для видобутку закритого набору предметів Мохаммедом Дж. Закі та Чін-жуй Сяо .

За даними цього джерела:

  • Набір елементів закривається, якщо жоден з його безпосередніх наборів не має такої ж підтримки, як набір елементів
  • Набір елементів є максимально частим, якщо жоден з його безпосередніх наборів не є частим


Деякі зауваження:

  • Необхідно встановити min_support (підтримка = кількість наборів елементів, що містить підмножину інтересів, поділену на кількість усіх наборів елементів), яка визначає, який набір елементів є частим . Набір елементів є частим, якщо його підтримка> = min_support.
  • Що стосується алгоритму, то, коли намагаються знайти максимально часті та закриті набори елементів, розглядаються лише набори елементів з min_support.
  • Важливим аспектом визначення закритого є те, що не має значення, чи існує негайний суперсет із більшою підтримкою, мають значення лише безпосередні суперсети з точно такою ж підтримкою.
  • максимально частий => закритий => частий, але не навпаки.

Застосування на прикладі ОП

Примітка:

  • Не перевіряли кількість підтримки
  • Скажімо, min_support = 0,5. Це виконується, якщо min_support_count> = 3
{A} = 4; не закрито через {A, E}
{B} = 2; не часто => ігнорувати
{C} = 5; не закрито через {C, E}
{D} = 4; не закрито через {D, E}, але не максимально, наприклад {A, D}
{E} = 6; закритий, але не максимальний через {D, E}

{A, B} = 1; не часто => ігнорувати
{A, C} = 3; не закрито через {A, C, E}
{A, D} = 3; не закрито через {A, D, E}
{A, E} = 4; закритий, але не максимальний через {A, D, E}
{B, C} = 2; не часто => ігнорувати
{B, D} = 0; не часто => ігнорувати
{B, E} = 2; не часто => ігнорувати
{C, D} = 3; не закрито через {C, D, E}
{C, E} = 5; закритий, але не максимальний через {C, D, E}
{D, E} = 4; закритий, але не максимальний через {A, D, E}

{A, B, C} = 1; не часто => ігнорувати
{A, B, D} = 0; не часто => ігнорувати
{A, B, E} = 1; не часто => ігнорувати
{A, C, D} = 2; не часто => ігнорувати
{A, C, E} = 3; максимально часті
{A, D, E} = 3; максимально часті
{B, C, D} = 0; не часто => ігнорувати
{B, C, E} = 2; не часто => ігнорувати
{C, D, E} = 3; максимально часті

{A, B, C, D} = 0; не часто => ігнорувати
{A, B, C, E} = 1; не часто => ігнорувати
{B, C, D, E} = 0; не часто => ігнорувати

Посилання на джерело розірвано, просто даючи вам знати. І так, min_support дуже важливий, я використовую .50
Майк Джон

1
Вибачте за це, виправлено.
steffen

1
змінив min_support = 0,5 <=> min_support_count = 3 і відповідно змінив додаток.
steffen

Використовуйте APRIORI, і ви можете заощадити багато підрахунку та побудови наборів предметів ...
Має QUIT - Anonymous-Mousse

@ Anonymous-Mousse Я знаю APRIORI ... Я переступив набір предметів вручну, щоб пояснити поняття закритих і максимально частих наборів предметів якомога детальніше, оскільки це було джерелом плутанини ОП (ІМХО).
steffen

1

Ви можете прочитати алгоритм APRIORI. Це дозволяє уникнути непотрібних наборів предметів розумною обрізкою.

{A} = 4 ;  {B} = 2  ; {C} = 5  ; {D} = 4  ; {E} = 6

Б не часто, видаліть.

Створіть і порахуйте набори двох предметів (магії ще немає, крім того, що Bвже вийшло)

{A,C} = 3; {A,D} = 3; {A,E} = 4; 
{C,D} = 3; {C,E} = 5; {D,E} = 3

Все це часто (зауважте, що все, що не Bмогло бути частим!)

Тепер використовуйте правило префікса. ТІЛЬКО комбінуйте набори предметів, починаючи з тих самих n-1 елементів. Видаліть усі, де будь-яка підмножина не є частою. Порахуйте решту наборів елементів.

{A,C,D} = 2; {A,C,E} = 3; {A,D,E} = 3; 
{C,D,E} = 3

Зауважте, що {A,C,D}це не часто. Оскільки спільного префіксу немає, більшого частого набору елементів не може бути!

Зауважте, наскільки менше роботи я зробив!

Для максимальних / закритих наборів елементів перевірте підмножини / супернабори.

Зауважте, що, наприклад {E}=6, і {A,E}=4. {E}є підмножиною, але має вищу підтримку, тобто вона закрита, але не максимальна. {A}не є ні тим, що не має вищої підтримки, ніж {A,E}, тобто є зайвою .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.