Яке значення мають подвійні бруски та 2 внизу у звичайних найменших квадратах?


10

Я бачив це позначення для звичайних найменших квадратів тут .

minwXwy22

Я ніколи не бачив подвійних брусків і 2 внизу. Що означають ці символи? Чи є для них конкретна термінологія?


5
Використання подвійних брусків просто вказує на те, що ми використовуємо норму L2.
Майкл Р. Черник

@MichaelChernick і 2? Це частина "норми L2"?
Асеем Бансал

1
Так, як і L2, є і L1.
Джон

Я думаю, що повинен бути оскільки - вектор X w wXwXww
ilanman

@ilanman Так, це було в позначеннях до редагування. Я змінив її назад
Aseem Bansal

Відповіді:


29

Ви говорите про (норма Евкліда) вектора ( ). Якщо вам це чуже, коротко, -норма вектора : X w - y p u R n2XwypuRn

up=(i=1n|ui|p)1p

Тож у вашому випадку що відповідає сумі квадратних залишків для лінійної регресії. У контексті проблем регресії ви також багато чого побачите в підрахунках середньої квадратичної помилки (MSE) та в регресії хребта .u22=((i=1n|ui|2)12)2=i=1nui2

Це звичайна норма (серед інших причин це математично зручно), тому коли це очевидно з контексту, ви побачите нижню опущені, і просто .u 22u2

Як згадується в коментарях, ви також можете побачити :1

u1=i=1n|ui|

Що відповідає абсолютній величині. Знову ж таки, ви побачите це в середній абсолютній помилці (МАЕ) або проблемах з ласо .

Інші популярні норми:

  • 10 -norm: відстань Хеммінга , або # ненулів у векторі, тобто для обчислення розрідженості вектора. Технічно це не норма (це функція кардинальності), оскільки у вас є термін , але він має форму норми, тому ми називаємо його одним. 10
    • Ця норма є ідеальною нормою, що застосовується для спонукання обмеженості для проблем регресії, оскільки ми дійсно хочемо нульові коефіцієнти, однак обчислення регуляризація є NP-важким, тому натомість ми наближаємо її до яке можна вирішити за допомогою лінійного програмування. Він також популярний у стисненому зондуванні .101
  • max i { | х i | } Я = 1 , . . . , н -norm: = дляmaxi {|xi|}i=1,...,n
  • A R n × m = AF : норма Фробеніуса (Евкліда), застосована до матриціARn×m=i=1nj=1m|aij|2

2
Посилання на альфа-вольфрам було дуже корисним.
Асеем Бансал

Ви пишете, що норма (псевдо) враховує кількість нулів у векторі - ви, можливо, мали на увазі кількість не- нульових записів? (Це буде більше відповідати тому, що я бачив, а також означало б, що буде відстань Хеммінга між та , на відміну від мінус цього відстань.)u 0 u 0 R n n0u0u0Rnn
wchargin

1
Орфографічна помилка: "Frobenius".
варення

1
Замість "це звичайна норма" я б тільки сказав "L2 - це норма";)
user541686
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.