Я намагаюся оцінити ефективність кластеризації. Я читав документацію по вивченню skiscit на метриках . Я не розумію різниці між ARI та AMI. Мені здається, що вони роблять одне й те саме двома різними способами.
Посилаючись на документацію:
Враховуючи знання присвоєння основного класу правди labels_true та призначення алгоритму кластеризації одних і тих же зразків labels_pred, скоригований індекс Rand є функцією, яка вимірює схожість двох призначень, ігноруючи перестановки та з можливістю нормалізації.
проти
Враховуючи знання присвоєння основного класу правди labels_true та призначення алгоритму кластеризації одних і тих же зразків labels_pred, Взаємна інформація є функцією, яка вимірює узгодження двох призначень, ігноруючи перестановки ... AMI було запропоновано недавно і нормалізується проти шанс.
Чи варто використовувати їх обох у своїй оцінці кластеризації чи це буде зайвим?