При NMF-факторизації параметр (відзначений r у більшості літератури) є рангом наближення V і вибирається таким, що k < min ( m , n ) . Вибір параметра визначає подання ваших даних V на надмірно повній основі, що складається із стовпців W ; the w i , i = 1 , 2 , ⋯ , k . Результати полягають у тому, що ряди матриць W і H мають верхню межуkrVk<min(m,n)VWwi , i=1,2,⋯,kWH і добуток W H - наближення низького рангу V ; також k максимум. Отже, вибір k < min ( m , n ) повинен являти собою зменшення розмірності, де V може бути сформований / віднесений від вищезгаданих векторів бази.kWHVkk<min(m,n)V
Більш детальну інформацію можна знайти в розділі 6 цієї книги С. Теодорідіса та К. Кутроумбаса.
Після мінімізації обраної вами функції витрат відносно і H , оптимальний вибір k ( вибраний емпіричним шляхом, працюючи з різними підпробілами функції) повинен дати V ∗ , наближення V , з особливостями, репрезентативними для вашої початкової матриці даних В . WHkV∗VV
Робота з різними підпросторами ознак у тому сенсі, що, кількість стовпців у W , - кількість базових векторів у підпросторі NMF. І емпірична робота з різними значеннями k рівнозначна роботі з функціональними просторами, зменшеними розмірністю.kWk