Початок роботи з бікстерстеру


9

Я робив якісь випадкові інтернет-дослідження щодо бікластерів. (Я прочитав статтю Вікі кілька разів.) Поки здається, ніби мало визначень чи стандартної термінології.

  1. Мені було цікаво, чи є якісь стандартні папери чи книги, які кожен, хто цікавиться алгоритмами пошуку бікластерів, повинен прочитати.

  2. Чи можна сказати, що таке сучасний стан у цій галузі? Мене заінтригувало уявлення про пошук бікластерів за допомогою генетичних алгоритмів, тому я би вдячний за коментарі до цього підходу, зокрема в контексті інших підходів.

  3. Зазвичай в кластеризації мета полягає в тому, щоб розділити набір даних на групи, де кожен елемент знаходиться в якійсь групі. Чи алгоритми бікластерів також прагнуть розмістити всі елементи в певній групі?

Відповіді:


16

Я ніколи не використовував його безпосередньо, тому можу поділитися лише деякими роботами, які я мав, і загальними думками щодо цієї техніки (які в основному стосуються ваших питань 1 і 3).

Моє загальне розуміння бікластерності в основному походить від генетичних досліджень (2-6), де ми прагнемо врахувати скупчення генів та групування особин: коротше, ми шукаємо групи зразків, що мають спільний профіль експресії генів разом (це може бути пов'язано наприклад, до хвороботворного стану) та генів, які сприяють цій схемі генопрофілювання. Огляд стану сучасних біологічних "масивних" наборів даних доступний на слайдах Пардалоса, Бікластерство . Зауважте, що існує пакет R, двосторонній , із програмами для мікромасиву даних.

Насправді, моя первісна ідея полягала в застосуванні цієї методології до клінічної діагностики, оскільки вона дозволяє розміщувати особливості або змінні в більш ніж одному кластері, що цікаво з семейологічної точки зору, оскільки симптоми, що скупчуються разом, дозволяють визначити синдром , але деякі симптоми можуть перекриваються при різних захворюваннях. Гарне обговорення може бути знайдено у Cramer et al., Comorbidity: A network perspect (Behavioral and Brain Sciences 2010, 33, 137-193).

Дещо споріднена техніка - спільна фільтрація . Су і Хошгофтаар (« Успіхи штучного інтелекту» , 2009) дали хороший огляд : опитування методів спільної фільтрації . Інші посилання наведені в кінці. Можливо, аналіз частого набору предметів , як це пояснюється в проблемі з ринковою кошиком , також пов'язаний з ним, але я цього ніколи не досліджував. Інший приклад спільної кластеризації - це коли ми хочемо одночасно кластеризувати слова та документи, як при видобутку тексту, наприклад, Dhillon (2001). Спільне кластеризація документів та слів за допомогою двостороннього розподілу спектральних графіків . Зб. KDD , стор. 269–274.

Щодо деяких загальних посилань, ось не дуже вичерпний список, який, я сподіваюся, може бути корисним:

  1. Джайн, АК (2010). Кластеризація даних: 50 років перевищує K-засоби . Листи розпізнавання шаблонів , 31 , 651–666
  2. Carmona-Saez та ін. (2006). Біклостеризація даних експресії генів негладкою матричною факторизацією . Біоінформатика BMC , 7 , 78.
  3. Prelic та ін. (2006). Систематичне порівняння та оцінка методів бісклістеризації даних про експресію генів . Біоінформатика , 22 (9) , 1122-1129. www.tik.ee.ethz.ch/sop/bimax
  4. DiMaggio та ін. (2008). Розбір даних через оптимальне переупорядкування матриць даних у біології систем: суворі методи та порівняльні дослідження . BMC Bioinformatics , 9 , 458.
  5. Сантамарія та ін. (2008). BicOverlapper: інструмент для візуалізації бікстертера . Біоінформатика , 24 (9) , 1212-1213.
  6. Мадейра, СК та Олівейра, AL (2004) Алгоритми Бікластера для аналізу біологічних даних: опитування . IEEE Trans. Обчислення. Біол. Біоінформ. , 1 , 24–45.
  7. Бадея, Л. (2009). Узагальнені кластерні програми для перекриття бікластерів . IJCAI
  8. Symeonidis, P. (2006). Спільне фільтрування з найближчими бікластерами . WEBKDD

1
Чудова відповідь. Якби я мав ще один голос, я би голосував за цю відповідь ще раз.
Генрі Б.

@chl Перше посилання на слайди Пардалоса, здається, мертве. Хтось знає про альтернативне місце?
Ерік

@Erik Більшість матеріалів із слайдів можна знайти в Послідовному розбитті через дробове програмування 0–1 того самого автора. (Я перевірив вміст слайдів зі своєю копією мертвого посилання.)
chl

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.