SVD корельованої матриці має бути добавкою, але, здається, не є


29

Я просто намагаюся повторити заяву, викладену в наступному документі, знаходження корельованих бікластерів з даних даних про вираження генів , а саме:

Пропозиція 4. Якщо . то ми маємо:XIJ=RICJT

i. Якщо є ідеальним бікластером з адитивною моделлю, то - це ідеальний бікластер з кореляцією по стовпцях; ii. Якщо - ідеальний бікластер з додатковою моделлю, то є ідеальним бікластером з кореляцією по рядках; iii. Якщо і і є ідеальними бікластерами з додатковою моделлю, то - ідеальний корельований бікластер. X I J C J X I J R I C J X I JRIXIJ
CJXIJ
RICJXIJ

Ці пропозиції можна легко довести ...

... але, звичайно, вони цього не доводять.

Я використовую кілька простих прикладів у папері плюс база + спеціальний R код, щоб побачити, чи можу я продемонструвати цю пропозицію.

corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)

(з таблиці 1F)

деякий спеціальний код для перетворення стандартної форми X = svd в як описано в статті: X = R C TUdVTX=RCT

svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
            # but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?

    R <- with(x, t(t(u) * sqrt(d)))
    C <- with(x, t(t(v) * sqrt(d)))

    if (!ignoreRank) {
        ind <- which(x$d >= zerothresh)
    } else {
        ind <- 1:r
    }

    return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}

застосувати цю функцію до набору даних:

 > svdToRC(svd(corbic))
$R
           [,1]       [,2]
[1,]  0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,]  4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752

$C
          [,1]       [,2]
[1,] -1.092343 -1.0037767
[2,]  1.223860 -0.9812343
[3,]  3.540063 -0.9586919
[4,] -3.408546 -1.0263191

Якщо я не галюциную, ці матриці не є добавками, навіть незважаючи на те, що в корбі показано ідеальне співвідношення між рядками та стовпцями. Дивно здається, що приклад, який вони надають, демонструє властивість, яку вони сказали, що це повинно ... хіба що я пропускаю якийсь крок до- або післясверднього перетворення?


3
Привіт, zzk: Це може допомогти коротко дати визначення ідеального бікластера, оскільки (а) не кожен може отримати доступ до паперу, і (b) це може означати пару різних речей, залежно від загальності, яку ви припускаєте.
кардинал

1
в основному, абсолютне значення балів парної кореляції між усіма рядками проти рядків та стовпців проти стовпців матриці
дорівнює

3
Я збентежений. Це не 4iiiкаже P(R), P(C), additivity => P(X)? (Я скорочую " Yце ідеальний бікстер" як P(Y)). Здається, ви йдете в іншому напрямку, очікуючи цієї адитивності від інших умов. Будь ласка, поясніть більше.
Stumpy Joe Pete

Stumpy - Я очікую на пристрасть до наукових досліджень, оскільки я знаю, що матриця, яку я постачаю (корбічна), виявляє ідеальну кореляцію - її ідеальний бікластер, як зазначено в самому документі.
zzk

6
Я все ще думаю, що ти йдеш у неправильному напрямку. 4iii не говорить , що якщо Xце цілком корелюють bicluster тоді Rі Cбуде добавка. Наслідок йде в інший бік. Тепер я погоджуюся, що дивно, що приклад, який вони наводять, не здається, що він узгоджується з теоремами, що знаходяться поруч. Можливо, є якась інша інформація, яку ви могли б надати? Чи є якась інша теорема, яка йде в іншому напрямку?
Stumpy Joe Pete

Відповіді:


2

Зауважимо, що "бікластер" у цій статті відноситься до підмножини матриці, "підмножини рядків, які демонструють подібну поведінку в підмножині стовпців, або навпаки". Ідентифікація бікластерів зазвичай проводиться в алгоритмах виведення даних. Автори випробовують нову "корельовану бікластерну модель", яка відрізняється від попередніх моделей, що використовуються для ідентифікації цих підмножин. Я нічого не знаю про генетику, але плутанина тут здається досить чіткою і походить з двох джерел:

1. Вживання слова "добавка"

У цьому документі немає нічого, що означає, що дві матриці, подані у виводі функції, повинні бути "аддитивними", якщо під "добавкою" додатковою інверсією є те, що означає ОП. У цьому сенсі автори не використовують словодобавку. Вони мають на увазі отримання бікластера з додатковою моделлю, "де кожен рядок або стовпець можна отримати, додавши константу в інший рядок або стовпець".

2. Неправильне пропозиція 4.3

Виходячи з коментаря @StumpyJoePete, пропозиція говорить про те, що якщо і і є ідеальними бікластерами з додатковою моделлю, то - ідеальний корельований бікластер. Автори не кажуть, що буде навпаки. Автори не заперечують, що якщо є ідеальним корельованим бікластером, то і будуть добавками - в будь-якому сенсі слова "добавка". Вони не говорять про те, що і повинні бути обернено аддитивними або що вони повинні бути в змозі відповідати моделі присадок. C J X I J X I J R I C J R I C JRICJXIJXIJRICJRICJ

* Крім того, приклади даних походять із зовсім іншого розділу статті, ніж пропозиції, обговорені у питанні.


Це здорово, коли нарешті відповіли [на сьогодні] найбільш відповідне питання без відповіді на нашому веб-сайті! +1, навіть якщо я не читав папери і не можу поручити, що те, що ви написали, є правильним; але це здається розумним.
амеба каже, що поверніть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.