Що таке "часткове" у методах часткових найменших квадратів?


16

На моделювання структурних рівнянь найменших квадратів (PLSR) або на часткові найменші квадрати (PLS-SEM), що означає термін "частковий"?


4
Зауважимо, що Уолд-молодший вважає, що назва "частковий найменший квадрат" вводить в оману, і його слід було назвати "проекцією на приховані простори".
Момо

@Momo: Так, я читав про це. Однак, навіть якщо ПЛС до певної міри вводить в оману, "проекція на приховані простори" є ще менш зрозумілою, не кажучи вже про відсутність зручності використання терміна в письмовій формі.
Олександр Блех

Відповіді:


17

Я хотів би відповісти на це питання, багато в чому спираючись на історичну перспективу , яка є досить цікавою. Герман Уолд, який винайшов підхід до часткових найменших квадратів (PLS) , не почав використовувати термін PLS (або навіть згадувати термін частковий ) відразу. Під час початкового періоду (1966-1969 рр.) Він назвав цей підхід NILES - скороченням терміна та назви його первинної роботи на цю тему " Нелінійне оцінювання методами ітеративних найменших квадратів" , опублікованих у 1966 році.

Як ми бачимо, процедури, які згодом будуть називатися частковими, називаються ітеративними , зосереджуючи увагу на ітераційному характері процедури оцінки ваги та прихованих змінних (НН). Термін "найменших квадратів" походить від використання регресії звичайних найменших квадратів (OLS) для оцінки інших невідомих параметрів моделі (Wold, 1980). Схоже, що термін "частковий" має коріння в процедурах NILES, які реалізували "ідею розділити параметри моделі на підмножини, щоб їх можна було оцінити по частинах" (Санчес, 2013, стор. 216; наголос мій) .

Перше використання терміна PLS відбулося в статті оцінки нелінійних ітераційних часткових найменших квадратів (NIPALS) , в якій публікація відзначає наступний період історії PLS - період моделювання NIPALS . 1970-ті та 1980-ті роки стають періодом м'якого моделювання , коли під впливом підходу Карла Жореського до LEMREL до SEM Волд перетворює підхід NIPALS в м'яке моделювання, що по суті сформувало ядро ​​сучасного підходу PLS (термін PLS стає мейнстрімом наприкінці 1970-х років) ). 1990-ті роки, наступний період в історії ПЛС, який Санчес (2013) називає періодом «розриву», відзначається значною мірою зменшенням його використання. На щастя, починаючи з 2000-х ( період консолідації)), PLS сподобалася поверненню як дуже популярний підхід до аналізу SEM, особливо в галузі соціальних наук.

ОНОВЛЕННЯ (у відповідь на коментар амеби):

  • Можливо, формулювання Санчеса не є ідеальним у фразі, яку я цитував. Я думаю, що "оцінюється по частинах" стосується прихованих блоків змінних. Уолд (1980) детально описує цю концепцію.
  • Ви праві, що NIPALS спочатку був розроблений для PCA. Плутанина випливає з того, що існують як лінійний підхід PLS, так і нелінійний PLS. Я думаю, що Rosipal (2011) дуже добре пояснює відмінності (принаймні, це найкраще пояснення, яке я бачив досі).

ОНОВЛЕННЯ 2 (подальше уточнення):

У відповідь на занепокоєння, висловлені у відповіді амеби, я хотів би уточнити деякі речі. Мені здається, що нам потрібно розрізнити вживання слова "частковий" між NIPALS та PLS. Це створює два окремих питання про 1) значення "часткового" в NIPALS та 2) значення "часткового" в PLS (це оригінальне запитання Phil2014). Хоча я не впевнений у першому, я можу запропонувати додаткові роз'яснення щодо другого.

За словами Уолда, Шьострем і Ерікссон (2001),

"Часткове" в PLS вказує на те, що це часткова регресія, оскільки ...

Іншими словами, "часткове" випливає з того, що декомпозиція даних за алгоритмом NIPALS для PLS може не включати всі компоненти , отже, "часткова". Я підозрюю, що ця ж причина стосується і NIPALS в цілому, якщо можливо використовувати алгоритм "часткових" даних. Це пояснило б "P" у NIPALS.

Що стосується використання слова "нелінійне" у визначенні NIPALS (не плутати з нелінійним PLS , який представляє нелінійний варіант підходу PLS!), Я думаю, що це стосується не самого алгоритму , а нелінійних моделей , якими може бути аналізували, використовуючи NIPALS на основі лінійної регресії.

ОНОВЛЕННЯ 3 (пояснення Германа Волда):

Незважаючи на те, що праця 1969 року Германа Волда, здається, є найбільш ранньою статтею про NIPALS, мені вдалося знайти ще одну з найбільш ранніх робіт на цю тему. Це документ Уолда (1974), де "батько" PLS представляє своє обгрунтування використання слова "частковий" у визначенні NIPALS (стор. 71):

3.1.4. Оцінка NIPALS: Ітеративний OLS. Якщо одна чи кілька змінних моделі є латентними, відносини прогнозування включають не тільки невідомі параметри, але й невідомі змінні, в результаті чого проблема оцінки стає нелінійною. Як зазначено в підпункті 3.1 (iii), NIPALS вирішує цю проблему ітераційною процедурою, скажімо, з кроками s = 1, 2, ... Кожен крок s включає кінцеву кількість регресій OLS, по одній для кожного відношення прогнозника моделі. Кожна така регресія дає проксі-оцінки для підмножини невідомих параметрів та прихованих змінних (звідси назва часткових найменших квадратів), і ці оцінки проксі використовуються на наступному етапі процедури для обчислення нових оцінок проксі.

Список літератури

Росипал, Р. (2011). Нелінійні часткові найменші квадрати: огляд. У Лодхі Х. та Яманіші Я. (ред.), Хіміоінформатика та перспективи перспективного машинного навчання: Комплексні обчислювальні методи та методи спільної роботи , с. 169-189. ACCM, IGI Global. Отримано з http://aiolos.um.savba.sk/~roman/Papers/npls_book11.pdf

Санчес, Г. (2013). Моделювання PLS-шляху з Р. Берклі, Каліфорнія: Видання Trowchez. Отримано з http://gastonsanchez.com/PLS_Path_Modeling_with_R.pdf

Уолд, Х. (1974). Причинно-наслідкові потоки з прихованими змінними: Розбиття шляхів у світлі моделювання NIPALS. Європейський економічний огляд, 5 , 67–86. Видавництво "Північна Голландія"

Уолд, Х. (1980). Побудова моделі та оцінювання, коли теоретичних знань не вистачає: теорія та застосування часткових найменших квадратів. У Дж. Кмента та Дж. Б. Рамзі (ред.), Оцінка економетричних моделей , стор. 47-74. Нью-Йорк: Академічна преса. Отримано з http://www.nber.org/chapters/c11693

Wold, S., Sjöström, M., & Eriksson, L. (2001). PLS-регресія: основний інструмент хіміометрії. Хімометрія та інтелектуальні лабораторні системи, 58 , 109-130. doi: 10.1016 / S0169-7439 (01) 00155-1 Отримано з http://www.libpls.net/publication/PLS_basic_2001.pdf


@amoeba: Я вважаю, що цей документ пояснює PLS на відміну від інших підходів більш технічним способом, про який ви нещодавно обговорювали. Однак зауважте, що вищевказане пояснення орієнтоване на регресію PLS, тоді як PLS включає декілька класів системного аналізу (див. Слайд 10 у наступній презентації). Технічні примітки на слайдах 25-29 також корисні для IMHO. Презентація: plsmodeling.com/pls/pls-introduction .
Олександр Блех

@ Олександр Блех: Це дуже приємні посилання.
Альф

Нічого собі, люди називають періоди історії ПЛС! Вражає.
Амеба каже, що поверніть Моніку

Хоча серйозно, я заглянув у книгу Санчеса, але все ще не розумію, що стосується NIPALS з "ідеєю розділити параметри моделі на підмножини, щоб їх можна було оцінити по частинах" . Спочатку NIPALS пропонувався як метод обчислення основних компонентів, правда? Це досить просто. Я не бачу «розбиття» параметрів на «підмножини», тому я не маю поняття, про що тут говорить Санчес. До речі, і я не розумію "нелінійного" в NIPALS. Звичайно, PCA - це лінійна техніка!
амеба каже, що повернеться до Моніки

@amoeba: Перегляньте моє оновлення у відповідь на ваш коментар. Сподіваюся, це допомагає.
Олександр Блех

7

XY

Однак історично, як @Aleksandr добре пояснює (+1), PLS був введений Уолдом, який використовував свій алгоритм NIPALS для його реалізації; NIPALS означає "нелінійні ітераційні часткові найменші квадрати", тому очевидно, що P у PLS щойно потрапив туди від NIPALS.

Xvpvp

  1. v=Xp(pp)1
  2. v1
  3. p=Xv(vv)1

vpX параметрів одночасно! Звідси "частковий".

(Чому він назвав це "нелінійним", я все ще не розумію.)

Цей термін надзвичайно оманливий, тому що якщо це "часткове", то кожен алгоритм максимізації очікування є "частковим" теж (насправді NIPALS можна розглядати як примітивну форму ЕМ, див. Roweis, 1998 ). Я думаю, що PLS є хорошим кандидатом у конкурсі «Найбільш оманливий термін у машинному навчанні». На жаль, це навряд чи зміниться, незважаючи на зусилля Уолда-молодшого (див. Коментар @ Момо вище).


Можливо, вас зацікавить ОНОВЛЕННЯ 2 моєї відповіді з подальшим роз'ясненням.
Олександр Блех

Дякую за те, що ви продовжували цю дискусію (щоб запобігти будь-яким непорозумінням, я мушу сказати, що я ні в якому разі не намагався вас критикувати!). Тепер, до вашого Update2. Чому, на ваш погляд, слід розрізняти значення "часткове" в PLS та NIPALS? Це звучить дивно; PLS виріс в результаті роботи над NIPALS, і це говорить про те, що його назва є просто скороченим "niPaLS". Це, мабуть, підтверджується Wold et al. Документ 2001 року, який ви знайшли: "Це включало простий, але ефективний спосіб оцінити параметри в цих моделях під назвою NIPALS [...]. Це призвело, в свою чергу, до абревіатури PLS для цих моделей" .
амеба каже, що поверніть Моніку

1
vpX

1
Чудово! Я думаю, що на питання нарешті відповіли задовільно. І я нарешті підтримав вашу відповідь, +1 :-) Я відредагував свою відповідь, щоб включити це нове розуміння. Щодо вашої відповіді: коли ви пояснювали слово "часткове" в "Оновлення 1" та "Оновлення 2", чи справді ви мали на увазі те саме, що ми домовились зараз? Для мене це виглядає так, що ваша відповідь наразі містить декілька різних інтерпретацій ...
Амеба каже, що повернеться Моніка

1
Не знаю! Можливо, це правильно. Чи можете ви детальніше розглянути, які «нелінійні моделі» можна проаналізувати за допомогою NIPALS та як? З іншого боку, це, мабуть, зовсім інша тема. Я здогадуюсь у тому, що Волд розробив NIPALS не для обчислення PCA заради себе, але мав на увазі деякі конкретні програми, де йому довелося вирішувати нелінійні проблеми і лінаризувати їх якось, зводячи до PCA? Сьогодні люди представляють NIPALS як простий алгоритм для обчислення провідних векторів сингулярності, але, можливо, Волд з 1969 року взагалі не погодився б на цю думку!
амеба каже, що повернеться до Моніки
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.