Коли ми читаємо книгу, розуміння позначень відіграє дуже важливу роль у розумінні змісту. На жаль, різні спільноти мають різні умовні позначення для формулювання моделі та проблеми оптимізації. Чи міг би хтось узагальнити деякі формулювальні позначення тут і навести можливі причини?
Я наведу приклад тут: У літературі лінійної алгебри класичною книгою є вступ Странга до лінійної алгебри . Найбільш використовувані позначення в книзі
Де - матриця коефіцієнтів , - розв'язувані змінні, а - вектор правої частини рівняння . Причина книга вибрати це позначення є основним завданням лінійної алгебри є рішення лінійної системи і з'ясувати , що вектор . Враховуючи таку формулювання, проблема оптимізації OLS є
У статистиці або машинному навчанні грамотних (з книги « Елементи статистичного навчання» ) люди використовують різні позначення, щоб представляти одне і те ж:
Де - матриця даних , - коефіцієнти або ваги, які слід вивчити , y - відповідь. У Причина люди використовують це тому , що люди в статистиці або машинного навчання спільноти керованих даними , тому дані і реакція найбільш цікава річ для них, де вони використовують X і Y представляють.у
Тепер ми можемо побачити, що все можливе плутанина може бути там: в першому рівнянні такий же, як і у другому рівнянні. А у другому рівнянні не потрібно щось вирішувати. Також для термінів: - матриця коефіцієнтів у лінійній алгебрі, але це дані в статистиці. також називають "коефіцієнтами".
Крім того, я згадав, що не є саме тим, що люди широко застосовують у машинному навчанні, люди використовують напіввекторизовану версію, яка підсумовує всі точки даних. Як от
Я думаю, що причина цього в тому, що це добре, коли говорити про стохастичний градієнтний спуск та інші різні функції втрат. Також стислі позначення матриці зникають для інших задач, ніж лінійна регресія.
Матричне позначення для логістичної регресії
Чи може хтось дати більше резюме на позначеннях, що перетинають різну літературу? Я сподіваюся, що розумні відповіді на це питання можуть бути використані як хороший орієнтир для людей, які читають книги, що перетинають різну літературу.
будь ласка, не обмежуйтеся моїм прикладом і . Є багато інших. Як от
Чому існує дві різні логістичні формулювання втрат / позначень?